(12) NACH DEM VERTRAG UBER DIE INTERNATIONALE ZUSAMMENARBEIT AUF DEM PFRIFT mr. 
PATENTWESENS (PCT) VEROFFENTL1CHTE INTERNATIONALE AnSSg 



(19) Weltorganisation fur geistiges Eigcntum 

Internationales Biiro 

(43) Internationales Veroffentlichungsdatum 
14. Juni 2001 (14.06.2001) 







III 



PCT 



(10) Internationale Veroffentlichungsnummer 



(51) Internationale Patentklassifikation 7 : C12Q 1/68 

(21) Internationales Aktenzeichen: PCT/DEOO/04381 

(22) Internationales Anmeldedatum: 

6. Dezember 2000 (06. 12.2000) 

(25) Einreichungssprache: Deulsch 

(26) Verdffentlichungssprache: Deutsch 

(30) Angaben zur Prioritat: 

199 59691.3 6. Dezember 1999 (06.12.1999) DE 

(71) Anmelder (fur alle Bestimmungsstaalen mitAusnahme von 
US): EPIGENOMICS AC [DE/DE]; Kastanienallee 24 
D- 1 0435 Berlin (DE). 

(72) Erfinder; und 

(75) Erfinder/Anmelder (nur fat US): OLEK, Alexander 
[DE/DE]; KyffhSuserstrasse 20, D- 10781 Berlin (DE) 
PIEPENBROCK, Christian [DE/DE]; Schwartzkopffs- 
trasse 7 B, D-101 15 Berlin (DE). 

(74) Anwalt: SCHUBERT, Kleraens; Joachimstrasse 9 
D-101 19 Berlin (DE). 



(81) Bestimmungsstaaten (national): AE, AG AL AM AT 

AU. AZ, BA, BB, BG. BR, BY, BZ, CA, CH, CN, CR, CU* 
CZ, DE, DK, DM. DZ, EE, ES, FI, GB, GD, GE, GH, Gm' 
HR, HU, ID, IL. IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK* 
■ LS ' LT - Lu - LV, MA, MD, MG, MK, MN, MW MX 
MZ, NO, NZ, PL, FT, RO, RU, SD, SE, SG, SI, SK, SL 
TI, TM. TR, TT. TZ, UA. UG, US, UZ, VN, YU, ZA, ZW.' 

(84) Bestimmungsstaaten (tegional); ARIPO-Patem (GH 
GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG ZW)' 
eurasisches Patent (AM, AZ, BY, KG, KZ, MD, RU Tj' 
TM). europaisches Patent (AT, BE, CH, CY DE DK 
ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, Se' TR)' 

OAPI-Patent (BF, BJ, CF, CG, CI, CM, GA. GN GW ML 
MR, NE, SN, TD, TG). ' 

VerSffentlicht: 

— Ohne intetnationalen Recherche nbericht und etneul zu 
verbffentHchen nach Erhalt des Berichts. 

Zur Erklarung der Zweibuchslaben-Codes, und der anderen 
AbkUrzungen wird auf die Erkldrungen ("Guidance Notes on 
Codes and Abbreviations") am Anfangjeder regularen Ausgabe 
der PCT-Gazette verwiesen. 



< 

rf 



o 



(54) Title: METHOD FOR THE PARALLEL DETECTION OFTHE DEGREE OF METHYLATION OF GENOMIC DNA 
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' h f e Ration of genomic DNA wherein 
into uracil, thymidine or another base ^^S^S^LT ^ W<»™ bases converts said bases 

(b) more than ten different fragments, SS^l^S^S hat ' h' 'k ° f Cyt ° Sine ' gen0mic DNA sam P le - 
amplified simultaneously using synthetic ofigonucloudes Z zTl I T ™? lM genomic DNA sam P*. « 

are involved in gene ^mJJ^^^^l^^l^ ^ P " merS eaCh COn,ain 8 enomic sequences which 

of,eps(a); ( c)Lseincecon^^ 

fragments are determined. P ^nucleotides orCpNpG trinucleotides contained in the amplified 
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der S'-Position unmethylierte Cytosinbasen in U racil Sl ol ? Behandlun 8 a " 

unahnliche Base urn; (b) aus dieser chemis^d ^ her *™ Cy.osin 

mente, die jeweils weniger als 2000 Basenpaare lans S 2 DNA amplifiziert man mehr als zehn unterschiedliche Frag- 
Primer, wobei diese Primer jeweils Sequenzen aus an der cl I T 8 durch , Verwendu , n g V °" s y» h «ischen Oligonukleotiden als 
genomischen Sequenzen enLten. Se nach IZr teuZl^ZZ ^Tt 7^ und/ °^ trans.atierten 

quenzkontex. aller Oder eines Tei.s der in den al iSerten S " 8 ? f 1 ■ (C) " ,an beslimmt den Se- 

aen amphfiztertcn Fragmenten enthaltenen CpG Dinukleotidc odcr CpNpG Trinukleotide. 
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Verfahren zur parallelen Detektion des Methylierungszustandes 

von genomischer DNA 

Die vorliegende Erfindung betrifft ein Verfahren zur parallelen Detektion des 
Methylierungszustandes von genomischer DNA. 

Die nach den methpdischen Entwicklungen der letzten Jahre in der Molekularbiologie 
gut studierten Beobachtungsebenen sind die Gene selbst, die Ubersetzung dieser 
Gene in RNA und die daraus entstehenden Proteine. Wann im Laufe der Entwicklung 
eines Individuums welches Gen angeschaltet wird und wie Aktivieren und Inhibieren 
bestimmter Gene in bestimmten Zellen und Geweben gesteuert wird, ist mit hoher 
Wahrscheinlichkeit mit Ausmaft und Charakter der Methylierung der Gene bzw. des 
Genoms korrelierbar. Insofern ist die Annahme naheliegend, dali pathogene Zustande 
sich in einem veranderten Methylierungsmuster einzelner Gene oder des Genoms 
auftern. 

Stand der Technik sind Verfahren, welche das Studium von Methylierungsmustern 
einzelner Gene gestatten. Jungere Fortentwicklungen dieser Methode erlauben auch 
die Analyse kleinster Mengen an AusgangsmateriaL Die vorliegende Erfindung 
beschreibt ein Verfahren zur parallelen Detektion des Methylierungszustandes 
genomischer DNA Proben, wobei ausgehend von einer Probe gleichzeitig zahlreiche 
verschiedenene Fragmente aus an der Genregulation beteiligten oder/und 
transkribierten und/oder translatierten Sequenzen amplifiziert werden und anschlieftend 
der Sequenzkontext in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide 
untersucht wird. 

5-Methylcytosin ist die haufigste kovalent modifizierte Base in der DNA eukaryotischer 
Zellen. Sie spielt beispielsweise eine Rolle in der Regulation der Transkription, 
genomischem Imprinting und in der Tumorgenese. Die Identifizierung von 5- 
Methylcytosin als Bestandteil genetischer Information ist daher von erheblichem 
Interesse. 5-Methylcytosin-Positionen konnen jedoch nicht durch Sequenzierung 
identifiziert werden, da 5-Methylcytosin das gleiche Basenpaarungsverhalten aufweist 
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wie Cytosin. Daruber hinaus geht bei einer PCR-Amplifikation die epigenetische 
Information, welche die 5-Methylcytosine tragen, vollstandig verloren. 
Die Modification der genomischen Base Cytosin zu 5'-Methylcytosin stellt den bis heute 
wichtigsten und best-untersuchten epigenetischen Parameter dar. Trotzdem gibt es bis 
heute zwar Methoden, umfassende Genotypen von Zellen und Individuen zu ermitteln, 
aber noch keine vergleichbaren Ansatze auch in groBem MaBe epigenotypische 
Information zu generieren und auszuwerten. 

Es sind im Prinzip drei prinzipiell verschiedene Methoden bekannt, den 5-Methyl-Status 
eines Cytosins im Sequenzkontext zu bestimmen. 

Die erste prinzipielle Methode beruht auf der Verwendung von Restriktionsendo- 
nukleasen (RE), welche „methylierungssensitiv" sind. REs zeichnen sich dadurch aus, 
daR sie an einer bestimmten DNA-Sequenz, meist zwischen 4 und 8 Basen lang, einen 
Schnitt in die DNA einfuhren. Die Position solcher Schnitte kann dann durch 
Gelektrophorese, Transfer auf eine Membran und Hybridisierung nachgewiesen 
werden. Methylierungssensitiv bedeutet, daS bestimmte Basen innerhalb der 
Erkennungssequenz unmethyliert vorliegen mussen, damit der Schnitt erfolgen kann. 
Das Bandenmuster nach einem Restriktionsschnitt und Gelektrophorese andert sich 
also je nach Methylierungsmuster der DNA. Allerdings befinden sich die wenigsten 
methylierbaren CpG innerhalb von Erkennungssequenzen von REs, konnen also nach 
dieser Methode nicht untersucht werden. 

Die Empfindlichkeit dieser Methoden ist extrem niedrig (Bird, A.P., and Southern, E.M., 
J.Mol. Biol. 118, 27-47). Eine Variante kombiniert PCR mit dieser Methode, eine 
Amplifikation durch zwei auf beiden Seiten der Erkennungssequenz liegende Primer 
erfolgt nach einem Schnitt nur dann, wenn die Erkennungssequenz methyliert vorliegt. 
Die Empfindlichkeit steigt in diesem Fall auf theoretisch ein einziges Molekul der 
Zielsequenz, allerdings konnen mit hohem Aufwand nur einzelne Positionen untersucht 
werden (Shemer, R. et al„ PNAS 93, 6371-6376). Wiederum ist Voraussetzung, daR 
sich die methylierbare Position innerhalb der Erkennungssequenz einer RE befindet. 
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Die zweite Variante beruht auf partieller chemischer Spaltung von Gesamt-DNA, nach 
dem Vorbild einer Maxam-Gilbert Sequenzierreaktion, Ligation von Adaptoren an die so 
generierten Enden, Amplifikation mit generischen Primern und Auftrennung auf einer 
Gelektrophorese. Mit diesem Verfahren konnen definierte Bereiche bis zur GroBe von 
weniger als tausend Basenpaaren untersucht werden. Das Verfahren ist allerdings so 
kornpliziert und unzuverlassig, da(i es praktisch nicht mehr verwendet wird (Ward, C. et 
al., J. Biol. Chem. 265, 3030-3033). 



Eine relativ neue und die mittlerweile am haufigsten angewandte Methode zur 
Untersuchung von DNA auf 5-Methylcytosin beruht auf der spezifischen Reaktion von 
Bisulphit mit Cytosin, das nach anschlieSender alkalischer Hydrolyse in Uracil 
umgewandelt wird, welches in seinem Basen-Paarungsverhalten dem Thymidin 
entspricht 5-Methylcytosin wird dagegen unter diesen Bedingungen nicht modifiziert. 
Damit wird die ursprungliche DNA so umgewandelt, dali Methylcytosin, welches 
ursprunglich durch sein Hybrid isierungsverhalten vom Cytosin nicht unterschieden 
werden kann, jetzt durch „normale" molekularbiologische Techniken als einzig 
verbliebenes Cytosin beispielsweise durch Amplifikation und Hybridisierung oder 
Sequenzierung nachgewiesen werden kann. Alle diese Techniken beruhen auf 
Basenpaarung, welche jetzt voll ausgenutzt werden kann. Der Stand der Technik, was 
die Empfindlichkeit betrifft, wird durch ein Verfahren definiert, welches die zu 
untersuchende DNA in einer Agarose-Matrix einschlie&t, dadurch die Diffusion und 
Renaturierung der DNA (Bisulphit reagiert nur an einzelstrangiger DNA) verhindert und 
alle Fallungs- und Reinigungsschritte durch schnelle Dialyse ersetzt (Olek, A. et al., 
Nucl. Acids. Res. 24, 5064-5066). Mit dieser Methode konnen einzelne Zellen 
untersucht werden, was das Potential der Methode veranschaulicht. Allerdings werden 
bisher nur einzelne Regionen bis etwa 3000 Basenpaare Lange untersucht, eine 
globale Untersuchung von Zellen auf Tausende von moglichen 
Methylierungsereignissen ist nicht moglich. Allerdings kann auch dieses Verfahren 
keine sehr kleinen Fragmente aus geringen Probenmengen zuverlassig analysieren. 
Diese gehen trotz Diffusionsschutz durch die Matrix verloren. 

Eine Ubersicht uber die weiteren bekannte Moglichkeiten, 5-Methylcytsosine 
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nachzuweisen, kann auch dem folgenden Ubersichtsartikel entnommen werden: Rein, 
T., DePamphilis, M. L, Zorbas, H., Nucleic Acids Res. 26, 2255 (1998). 

Die Bisulphit-Technik wird bisher bis auf wenige Ausnahmen (z.B. Zeschnigk, M. et al., 
Eur. J. Hum. Gen. 5, 94-98; Kubota T. et al., Nat. Genet. 16, 16-17) nur in der 
Forschung angewendet. Immer aber werden kurze, spezifische Stucke eines 
bekannten Gens nach einer Bisulphit-Behandlung amplifiziert und entweder komplett 
sequenziert (OIek, A. and Walter, J., Nat. Genet. 17. 275-276) oder einzelne Cytosin- 
Positionen durch eine ..Primer-Extension-Reaktion" (Gonzalgo, M. L. and Jones, P.A 
Nucl. Acids. Res. 25. 2529-2531) oder Enzymschnitt (Xiong, Z. and Laird, P.W., Nucl. 
Acids. Res. 25, 2532-2534) nachgewiesen. Zudem ist auch der Nachweis durch 
Hybridisierung beschrieben worden (OIek et al, W09928498). 

Gemeinsamkeiten zwischen Promotoren bestehen nicht nur im Vorkommen von TATA- 
oder GC-Boxen sondern auch darin. fur welche Transkriptionsfaktoren sie Bindestellen 
besitzen und in welchem Abstand diese sich zueinander befinden. Die existierenden 
Bindestellen fur ein bestimmtes Protein stimmen in ihrer Sequenz nicht vollstandig 
Oberein, es finden sich aber konservierte Folgen von mindestens 4 Basen die durch 
das Einfugen von ..Wobbles", d. h. Positionen, an denen sich jeweils unterschiedliche 
Basen befinden, noch verlangert werden konnen. Des weiteren liegen diese 
Bindestellen in bestimmten Abstanden zueinander vor. 

. Die Verteilung der DNA im Interphase-Chromatin, das den gro&ten Teil des nuklearen 
Volumens einnimmt. unterliegt jedoch einer ganz speziellen Ordnung. So ist die DNA 
an mehreren Stellen an die nukleare Matrix, eine filamentose Struktur an der Innenseite 
der nuklearen Membran. angeheftet. Diese Regionen bezeichnet man als matrix 
attachment regions (MAR) oder scaffold attachment regions (SAR). Das Anheften hat 
wesentlichen Einfluli auf die Transkription bzw. die Replikation. Diese MAR-Fragmente 
weisen keine konservativen Sequenzen auf, bestehen allerdings zu 70% aus A bzw T 
und liegen in der Nahe von cis-agierenden Regionen, die die Transkription allgemein 
regulieren, und Topoisomerase ll-Erkennungsstellen. 
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Neben Promotoren und Enhancern existieren weitere regulatorische Elemente fur 
verschiedene Gene, sogenannte Insulators. Diese Insulators konnen z.B. die Wirkung 
des Enhancers auf den Promotor inhibieren, wenn sie zwischen Enhancer und 
Promotor liegen, oder aber, zwischen Heterochromatin und einem Gen gelegen, das 
aktive Gen vor dem EinfluR des Heterochromatins schutzen. Beispiele fur solche 
Insulators sind: 1. sogenannte LCR (locus control regions), welche aus mehreren 
gegeniiber DNAase I hypersensitiven Stellen besteht; 2. bestimmte Sequenzen wie 
SCS (specialized chromatin structures) bzw. SCS\ 350 bzw. 200 bp lang und hoch- 
resistent gegen Degradierung durch DNAase I und auf beiden Seiten von 
hypersensitiven Stellen flankiert (Abstand je 100 bp). An scs* bindet das Protein BEAF- 
32. Diese Insulators konnen auf beiden Seiten des Gens liegen. 

Eine Obersicht uber den Stand der Technik in der Oligomer Array Herstellung laBt sich 
auch einer im Januar 1999 erschienen Sonderausgabe von Nature Genetics (Nature 
Genetics Supplement, Volume 21, January 1999) und der dort zitierten Literatur 
entnehmen. 

Patente, die sich allgemein auf die Verwendung von Oligomer Arrays und 
photolithographisches Maskendesign beziehen, sind z. B. US-A 5,837,832, US-A 
5,856,174, WO-A 98/27430 und US-A 5,856,101. Zudem existieren einige Stoff- und 
Verfahrenspatente, welche die Verwendung photolabiler Schutzgruppen an 
Nukleosiden einschranken, so z. B. WO-A98/39348 und US-A 5,763,599. 

Matrix-assistierte Laser Desorptions/lonisations Massenspektrometrie (MALDI) ist eine 
neue, sehr leistungsfahige Entwicklung fur die Analyse von Biomolekulen (Karas, M. 
and Hillenkamp, F. 1988. Laser desorption ionization of proteins with molecular masses 
exceeding 10.000 daltons. Anal. Chem. 60: 2299-2301). Ein Analytmolekul wird in eine 
im UV absorbierende Matrix eingebettet. Durch einen kurzen Laserpuls wird die Matrix 
ins Vakuum verdampft und das Analyt so unfragmentiert in die Gasphase befordert. 
Eine angelegte Spannung beschleunigt die lonen in ein feldfreies Flugrohr. Auf Grund 
ihrer verschiedenen Massen werden lonen unterschiedlich stark beschleunigt. Kleinere 
lonen erreichen den Detektor fruher als groBere und die Flugzeit wird in die Masse der 
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lonen umgerechnet. 

Fiir die Abtastung eines immobilisierten DNA-Arrays sind vielfach fluoreszent markierte 
Sonden verwendet worden. Besonders geeignet sind fiir die Fluoreszenzmarkierung ist 
das einfache Anbringen von Cy3 und Cy5 Farbstoffen am 5'OH der jeweiligen Sonde 
Die Detektion der Fluoreszenz der hybridisierten Sonden erfolgt beispielsweise uber ein 
Konfokalmikroskop. Die Farbstoffe Cy3 und Cy5 sind, neben vielen anderen 
kommerziell erhaltlich. 

Um die erwartete Anzahl von amplifizierten Fragmenten ausgehend von einer 
behebigen Templat-DNA und zweien nicht fur jeweils eine bestimmte Position 
spezifischen Primern zu berechnen, muli ein statistisches Modell Qber den Aufbau des 
Genoms zu Grunde gelegt werden. 

Wir geben hier die Berechnung fur drei Modelle an, beziehen uns allerdings in diesem 
Patent auf die in Modell 3 beschriebene Methode. 

Modell 1 : 

Im einfachsten Fall wird angenommen, daft ein primarer DNA-Strang eine Zufallsfolge 
von vier gleich haufig vorkommenden Basen ist. Damit ergibt sich als 
Wahrscheinlichkeit. daS sich fur einen beliebiger Primer PrimA (der Lange ft) an einer 
gegebenen Stelle im Genom eine perfekte Basenpaarung ergibt: 

P„ (PrimA)=0.25 k (Modell 1 fur DNA) 

(diese Wahrscheinlichkeit ist fiir den sense- und anti-sense-Strang der DNA gleich) 

Bei einer Bisulfitbehandlung der DNA werden diejenigen Cytosine durch Uracil ersetzt 
d.e n,cht zu einem methy.ierten CG gehoren. Das Basenpaarungsverhalten des Uracils 
entspricht dem des Thymins. Da CG in der DNA sehr se.ten sind (unter zwei Prozent) 
kann die statistische Haufigkeit der Cs nach der Bisulfitbehandlung vernachlassigi 
werden. Die Wahrscheinlichkeit, daS sich fur einen Primer PrimB (Lange k davon a As 
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t Ts, g Gs und c Cs) auf bisulfitbehandelter DNA eine perfekte Basenpaarung ergibt, ist 
unterschiedlich fur einen mit Bisulfit behandelten Strang und den zugehorigen anti- 
sense Strang: 

P h {PrimB)=0.5" *0.25'*0.25 c *0 g (Modell 1 fur Bisulfit-DNA-Strang) 

P la (/Vwifl)=0.25 fl *0.5'*0 c *0.25* (Modell 1 fur anti-sense-Strang zu einem 
Bisulfit-DNA-Strang) 

(wenn der Primer C oder G enthalt, wird somit einer der Wahrscheinlichkeitswerte 0). 



Modell 2: 

Zahlungen der Basenhaufigkeiten der DNA ergeben, dad die vier Basen in der DNA 
nicht gleichverteilt sind. Entsprechend kann man aus DNA-Datenbanken folgende 
Haufigkeiten (Wahrscheinlichkeiten fur ein Vorkommen) der Basen ermitteln. 

P DAM (,4)=0.2811 
P DM ,(7>0.2784 
P DM {C)=0.2206 
P DNA (G)=0.2\99 

Als Grundlage fur diese Statistik (und die folgenden fur Modell 2 und 3) dienen ca. 6% 
des Genoms vom Homo Sapiens aus High Throughput Sequencing Projekten 
(Datenbank "htgs" vom NIH/NCBI vom 6.9.1999). Die Gesamtmenge der Daten betragt 
mehr als 1.5x10 8 Basenpaare, was einem Schatzfehler fur die 
Einzelwahrscheinlichkeiten kleiner 10 5 entspricht. 

Mit Hilfe dieser Werte lalit sich das Modell 1 verbessem. 

Damit ist die Wahrscheinlichkeit, daft sich fur einen Primer PrimC (Lange k, davon a 
As, t Ts, g Gs und c Cs) eine perfekte Basenpaarung ergibt: 
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P2(Pri m C)=P^{Tr*p DfU (A)'*P mi (cY*P au (GY (Modell 3 fur DNA) 

Fur den mit Bisulfit behandelten Strang ergeben sich folgende Wahrscheinlichkeiten 
unter der Annahme, dalJ alle CpG-Positionen methyliert sind (man erhalt eine gleiche 
Statistik for die Bisulfitbehandlung des DNA-sense- und des DNA-antisense-Stranges): 

P bDN AA)=0.2S\\ 
^WC)=0.0140 
*WG)=0.2199 
P b D»AT)=0AZ50 

Damit ergibt sich a Is Wahrscheinlichkeit, daG sich fur einen Primer PrimD (Lange k, 
davon a As, t Ts, g Gs und c Cs) eine perfekte Basenpaarung ergibt: 

P2.(J^)=P^(Ty*P^(AY*P U3tu (cr*P bm ,( G y (Modell 3 fur Bisulfit-DNA- 
Strang) 

P»l'rinD)=P^[Ar*P^(Ty*P^ {G Y* FlouiC y (Mo de.l 3 fur anti-sense- 
Strang zu einem Bisulfit-DNA-Strang) 

Modell 3: 

Wesentliche Schatzfehler in Modell 2 ergeben sich vor allem bei der mit Bisulfit 
behandelten DNA aus der Tatsache, daR C nur noch im Kontext CG auftreten kann 
Modell 3 berucksichtigt diese Eigenschaft und nimmt an, daft die primare DNA eine 
Zufallsfolge mit Abhangigkeit direkt benachbarter Basen ist (Markov-Kette erster 
Ordnung). Die empirisch aus der Datenbank (vollstandig methyliert; mit Bisulphit 
behandelt) ermittelten paarweisen Basenwahrscheinlichkeiten ergeben sich gleich fur 
beide DNA-Strange als P hDNA (von;nach) aus der folgenden Tabelle: 
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Von\nach 


A 


C 


G 


T 


A 


0.0894 


0.0033 


0.0722 


0.1162 


C 


0.0 


0.0 


0.0140 


0.0 


G 


0.0603 


0.0036 


0.0601 


0.0959 


T 


0.1314 


0.0071 


0.0736 


0.2729 



P iDNA (A)=0.2i\\ 
JWO=0.0140 
^(G)=0.2199 



und fOr den dazu revers-komplementaren Strang (durch entsprechendes Austauschen 
der Eintrage) P rbD m ( von • nach) 



Von\nach 


A 


C 


G 


T 


A 


0.2729. 


0.0959 


0.0 


0.1162 


C 


0.0736 


0.0601 


0.0140 


0.0722 


G 


0.0071 


0.0036 


0.0 


0.0033 


T 


0.1314 


0.0603 


0.0 


0.0894 



^dm<M)=0.4850 ; 
P, bDN AC)=0.2l99 



rbDNA 



(G)=0.0140 



^(^=0.2811 

Damit hSngt die Wahrscheinlichkeit, dafJ sich fur einen Primer PrimE (mit der 
Basenfolge Bi B 2 B 3 B 4 z.B. ATTG...) eine perfekte Basenpaarung ergibt, von der 
genauen Abfolge der Basen ab und ergibt sich als das Produkt: 



P 3j (Pri»iE)=P rbDNA (Bi) 



* rbDNA * rbDNA 1 rbDNA (B, ; B 4 ) 



rbDNA 



(5.) 



rbDNA 



(B 2 ) 



rbDNA 



(B 3 ) 



(Modell 3 fur 



»♦ 
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Bisulfit-DNA-Strang) 

P,(PrimE) = P ( ft ) PbDNA ^' ' B ^ P ^ B "- >' B J P ^AB , ; B A ) 
anti-sense-Strang zu einem Bisulfit-DNA-Strang) 

Berechnung der Anzahl der zu erwartenden amplifizierten Fragmente 

Die mit Bisulfit behandelte DNA wird unter Benutzung einer Anzahl Primer amplifiziert. 
Aus Sicht des Modells besteht die DNA aus je einem sense- und einem anti-sense- 
Strang der Lange N Basen (alle Chromosomen werden hier zusammengefa&t). Fur 
einen Primer Prim ist zu erwarten, daS er auf dem sense-Strang 

N*P s (Prim) 

perfekte Basenpaarungen ergibt - fur diese Berechnung konnen die Funktionen P 1Sl P 2s 
Oder P 3S von Modell 1 , 2 oder 3 eingesetzt werden, je nach gewunschter 
Abschatzungsgute. Werden mehrere Primer (PrimU, PrimV, PrimW, PrimX, etc.) 
gleichzeitig verwendet, ergibt sich als Wahrscheinlichkeit fur eine perfekte 
Basenpaarung auf dem sense-Strang an einer gegebenen Position: 

P s ( Primers )=P,{ Prim U ) 

+{\- P x ( PrimU ))P s (PhmV) 

+( \-P,(PrimU)){\- P s ( Prim V))P X { Prim W ) 

+{\-P s (PrimU)){l- />;:■( Prim V ) ) ( 1 - P x {PrimW)) P s ( PrimX ) 
+ 



Und damit als Anzahl der zu erwartenden perfekten Basenparungen mit irgendeinem 
der Primer 



N*P t ( Primers) 
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Fur die Bestimmung von P a (Primers) auf dem anti-sense-Strang werden die analogen 
Gleichungen verwendet. Ein Amplifikat entsteht genau dann, wenn bei einer perfekten 
Basenpaarung auf dem sense-Strang innerhalb der maximalen Fragmentlange M ein 
Primer auf dem Gegenstrang eine perfekte Basenpaarung bildet Die 
Wahrscheinlichkeit dafur ist 



M-2 



Zivj — J. 
(l-P a {Primers)) 



Fur grolie M und kleine P a (Phmers) kann dieses durch folgenden Ausdruck berechnet 
werden: 

\-P Q {Primers) . M 



log ( 1 - P u (Primers)) 



\{\-P a {Primers)) M -\) 



Fur die Gesamtzahl F der Fragmente, die durch die Amplifikation beider Strange zu 
erwarten sind, ergibt sich damit: 



F=N , Farmers ) - ( , _^ { — ); | (.-!». ( Pri.ers))" - , | 

4 (1 - P A Primers)) , , 
+N *P 0 (Primers) / A " [(\-P s (Primers ))"-]} 

log ( 1 — P ..{Primers )) 



Diese Methode liefert einen prazisen Erwartungswert fur die Vorhersage der Anzahl der 
Bindungssites bestimmter Sequenzen an ein beliebiges zuvor mit Bisulfit behandeltes 
genomisches DNA Fragment. Sie dient hier als Grundlage fur die Berechnung der 
statistisch erwarteten Anzahl von Amplifikaten in einer PCR-Reaktion ausgehend von 
zwei Primersequenzen und einer DNA der Lange A/ t wobei nur die Amplifikate 
berucksichtigt werden, die eine Anzahl von M Nukleotiden nicht iiberschreiten. In 
diesem Patent wird davon ausgegangen, daB M den Wert 2000 hat. 
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Die bekannten Verfahren fur den Nachweis von Cytosin Methylierungen in genomischer 
DNA sind prinzipiell nicht so ausgelegt, daft eine Vielzahl von Zielregionen im zu 
untersuchenden Genom gleichzeitig erfaRt werden. Aufgabe der vorliegenden 
Erfindung ist es, ein Verfahren zu schaffen, mit dem eine Probe genomischer DNA 
gle,chzeitig an mehreren Positionen gleichzeitig auf Cytosin Methylierung hin 
untersucht werden kann. 

Die Aufgabe wird durch die kennzeichnenden Merkmale des Anspruchs 1 geldst 
Vorteilhafte Weiterbildungen der Merkmal sind in den abhangigen Anspriichen 
gekennzeichnet. 

Im Unterschied zu anderen Verfahren kann nach chemischer Vorbehandlung der DNA 
durch Verwendung entsprechend angepaSter Primerpaare eine Amplifikation von vielen 
Z,elreg,onen gleichzeitig erfolgen. Dabei ist es nicht unbedingt notwendig den 
Sequenzkontext aller dieser Zielregionen vorab zu kennen. da in vielen Fallen wie 
nachfolgend auch beispielhaft aufgefiihrt, Konsensussequenzen aus der 
Sequenz.erung verwandter Zielregionen bekannt sind, die wie unten beschrieben fur 
das Design fur bestimmte Zielregionen spezifischer Oder selektiver Primerpaare 
e.ngesetzt werden kSnnen. Das Verfahren ist dann erfolgreich angewandt, wenn die 
Amplifikation der chemisch vorbehandelten genomischen DNA mehr Fragmente bis 
maximal 2000 Basenpaare Lange als statistisch zu erwarten aus den jeweils zu 
untersuchenden Zielregionen liefert. 

Dabei wird der statistische Erwartungswert fur die Anzahl dieser Fragmente uber die im 
Stand der Technik aufgefuhrten Formeln berechnet. Die Anzahl der im 
Amplifikationsschritt hergestellten Fragmente kann dagegen mittels einer beliebigen 
molekularbiologischen, chemischen oder physikalischen Methode nachgewiesen 
werden. 

Fur die Durchfuhrung der erforderlichen statistischen Betrachtungen. die auch fur die 
unten aufgefuhrten AnsprGche relevant sind, werden die folgenden Werte 
angenommen: 
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Das menschliche haploide Genom enthalt 3 Milliarden Basenpaare und 100.000 Gene, 
die wiederum im Mittel eine 2000 Basenpaare lange mRNA codieren, die Gene 
inklusive der Introns sind durchschnittlich 15000 Basenpaare lang. Promotoren 
umfassen je Gen 1000 Basenpaare durchschnittlich. 1st daher der statistische 
Erwartungswert fur die Anzahl der Amplifikate, die ausgehend von zwei Primern in 
transkribierten Sequenzen liegen, zu berechnen, so ist zunachst der Erwartungswert fur 
das Gesamtgenom nach obiger Formel (Methode 3) zu berechnen und mit dem Anteil 
der transkribierten Sequenzen am Gesamtgenom zu berechnen. Analog wird fur Teile 
eines beliebigen Genoms sowie fur Promotoren und translatierte Sequenzen (mRNA 
codierend) vorgegangen. 

Die vorliegende Erfindung beschreibt somit ein Verfahren zur parallelen Detektion des 
Methyiierungszustandes genomischer DNA. Dabei sollen mehrere Cytosin- 
Methylierungen in einer DNA-Probe gleichzeitig analysiert werden. Dazu werden die 
folgenden Verfahrensschritte nacheinander ausgefiihrt: 

Zuerst wird eine genomische DNA Probe derail chemisch behandelt, daft an der 5'- 
Position unmethylierte Cytosinbasen in Uracil, Thymin oder eine andere vom 
Hybridisierungsverhalten her dem Cytosin unahnliche Base verwandelt werden. 
Bevorzugt wird dazu die oben beschriebene Behandlung genomischer DNA mit Bisulfit 
(Hydrogensulfit, Disulfit) und anschlieliender alkalischer Hydrolyse verwendet, die zu 
einer Umwandlung nicht methylierter Cytosin-Nukleobasen in Uracil fuhrt 

In einem zweiten Verfahrensschritt werden aus der vorbehandelten genomischen DNA 
mehr als zehn unterschiedliche Fragmente gleichzeitig durch Verwendung von 
synthetischen Oligonukleotiden als Primer amplifiziert, wobei mehr als doppelt so viele 
Fragmente als statistisch zu erwarten aus an der Genregulation beteiligten, 
transkribierten und/oder translatierten Sequenzen stammen. Dies kann mittels 
verschiedener Methoden erreicht werden. 

In einer bevorzugten Variante des Verfahrens enthalt mindestens eines der fur die 
Amplifikation verwendeten Oligonukleotide weniger Nukleobasen als es statistisch fur 
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e.ne sequenzspezifische Hybridisierung an die chemisch behandelte genomische DNA 
Probe erforderlich ware, was zur Amplication mehrerer Fragmente gleichzeitig fuhren 
kann. Dabei ist die Gesamtzahl der in diesem Oligonukleotid enthaltenen Nukleobasen 
kle.ner als 17. In einer besonders bevorzugten Variante des Verfahrens ist die Anzahl 
der in diesem Oligonukleotid enthaltenen Nukleobasen kleiner als 14. 

In einer weiteren, bevorzugten Variante des Verfahrens werden fur die Amp.ifikation 
mehr als 4 Oligonuk.eotide mit unterschied.icher Sequenz gleiohzeitig in einem 
Reaktonsgefia verwendet. In einer besonders bevorzugten Varianten werden zur 
Herstellung eines komplexen Amplifikates mehr als 26 verschiedene Oligonukleotide 
gle,chzeitig verwendet. In einer besonders bevorzugten Variante des Verfahrens 
stammt mehr als eine doppelt so hohe Anzahl, wie statistisch zu erwarten, aus an der 
Regulation von Genen beteiligten Genomabschnitten, z.B. Promotoren und Enhanoern 
stammt, als bei einer rein zufalligen Wahl der Oligonuk.eotidsequenzen zu erwarten 
ware. In einer weiteren besonders bevorzugten Variante des Verfahrens stammt mehr 
als erne doppelt so hohe Anzahl der amplifizierten Fragmente aus Genomabschnitten 
d.e ,n mmdestens einer Zelle des jeweiligen Organismus in mRNA transkribiert werden' 
Oder aber aus nach der Transition in mRNA gesp.ioeten Genomabschnitten 
(Exons), als bei einer rein zufalligen Wahl der Oligonukleotidsequenzen zu erwarten 



ware. 



In e.ner weiteren besonders bevorzugten Variante des Verfahrens stammt mehr als 
e.ne doppe.t so hohe Anzahl der amplifizierten Fragmente aus Genomabschnitten 
welche fur Teile einer oder mehrerer Genfamilien kodieren, oder aber sie stammen aus 
Genomabschnitten, welche fur sogenannte „matrix attachment sites" (MARs)- 
charakteristische Sequenzen enthalten, als bei einer rein zufalligen Wah. der 
Oligonukleotidsequenzen zu erwarten ware. 

In einer weiteren besonders bevorzugten Variante des Verfahrens stammt mehr als 
eine doppelt so hohe Anzahl der amplifizierten Fragmente aus Genomabschnitten 
welche als sogenannte ..boundary elements" die Verpackungsdichte des Chromatins 
orgams.eren, oder aber sie stammen aus multiple drug resistance gene" (MDR) 
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Prornotoren Oder kodierenden Regionen, als bei einer rein zufalligen Wahl der 
Oligonukleotidsequenzen zu erwarten ware. 

In einer weiteren, besonders bevorzugten Variante des Verfahrens werden zur 
Amplifkation der beschriebenen Fragmente zwei Oligonukleotide oder zwei Klassen von 
Oligonukleotiden verwendet, von denen eines oder eine Klasse au&er im Kontext CpG 
oder CpNpG zwar die Base C enthalten kann, nicht aber die Base G und von denen 
das andere oder die andere Klasse auBer im Kontext CpG oder CpNpG zwar die Base 
G, nicht aber die Base C enthalten kann. 



In einer weiteren bevorzugten Variante des Verfahrens wird die Amplifikation mittels 
zweier Oligonukleotide durchgefuhrt, von denen eines eine vier bis sechzehn Basen 
lange Sequenz enthalt, die zu einer solchen DNA komplementar ist oder dieser 
entspricht, wie sie entstehen wurde, wenn ein ebenso langes DNA Fragment, an 
welches einer der Faktoren 



AhR/Arnt 

Arnt 
AML-1a 

AP-1 

C/EBP 

C/EBPalpha 

C/EBPbeta 

CDP 

CDP 

CDP CR1 
CDP CR3 
CHOP-C/EBPalpha 

c-Myc/Max 

CREB 
CRE-BP1 



CRE-BP1/c-Jun 



aryl hydrocarbon receptor/aryl hydrocarbon receptor nuclear 
translocator 

aryl hydrocarbon receptor nuclear translocator 
CBFA2; core-binding factor, runt domain, alpha subunit 2 
(acute myeloid leukemia 1; aml1 oncogene) 
activator protein-1 (AP-1); Synonyme: c-Jun 
CCAAT/enhancer binding protein 
CCAAT/enhancer binding protein (C/EBP), alpha 
CCAAT/enhancer binding protein (C/EBP), beta 
CUTL1; cut (Drosophila)-like 1 (CCAAT displacement 
protein) 

CUTL1; cut (Drosophila)-like 1 (CCAAT displacement 
protein) 

complement component (3b/4b) receptor 1 

complement component (3b/4b) receptor 3 

DDIT; DNA-damage-inducible transcript 3/CCAAT/enhancer 

binding protein (C/EBP), alpha 

avian myelocytomatosis viral oncogene/MYC-ASSOCIATED 
FACTOR X 

cAMP responsive element binding protein 
CYCLIC AMP RESPONSE ELEMENT-BINDING PROTEIN 
2, CREB2, CREBP1; now ATF2; activating transcription 
factor 2 

activator protein-1 (AP-1); Synonyme: c-Jun 



4 
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CREB 
E2F 



E47 

E47 

Egr-1 
Egr-2 
ELK-1 

Freac-2 

Freac-3 

Freac-4 

Freac-7 

G ATA- 1 
G ATA- 1 
GATA-1 
GATA-2 
GATA-3 
GATA-X 
HFH-3 

HNF-1 

HNF-4 
IRF-1 

ISRE 

Lmo2 complex 
MEF-2 

MEF-2 

myogenin/NF-1 
MZF1 
MZF1 
NF-E2 

NF-kappaB (p50) 
NF-kappaB (p65) 



MP responsive element binding protein 
E2F transcription factor (originally identified as a DNA- 
binding protein essential E1A-dependent activation of the 
adenovirus E2 promoter) 

transcription factor 3 (E2A immunoglobulin enhancer binding 
factors E12/E47) a 

factoS E^/E^^ 3 immunoglobulin enn ancer binding 
early growth response 1 

early growth response 2 (Krox-20 (Drosophila) homolog) 
fcLKI, member of ETS (environmental tobacco smoke) 
oncogene family 

ACtIvATOR 2 a FREAC2 Phila) " like * F0RKHEAD - RELATED 
ACTIVATO^ ? ' F0RKHEAD - RELATED 

ACtIvATOR^ 8; FORKHEAD-RELATED 

FKHL11; forkhead (Drosophila)-like 9; FORKHEAD- 
RELATED ACTIVATOR 7; FREAC7 

2 A I A "? ind J ng protein 1/E nhancer-Binding Protein GATA1 
?aI A i! n 5! n 9 P rotein 1/Enhancer-Binding Protein GATA1 
2 A I A "u' n ? ng protein Enhancer-Binding Protein GATA1 
SaJa'u" 1 ?" 9 protein 2/En hancer-Binding Protein GATA2 ' 
GATA-binding protein 3/Enhancer-Binding Protein GATA3 

^l:i?- : i 0rknead (Drosophila)-like 10; FORKHEAD- 
RELATED ACTIVATOR 6; FREAC6 

I^l : mt^ C [ ipt r faCt ° r 1l hepatic; LF " B1 ' nepatic nuclear 
factor (HNF1), albumin proximal factor 

hepatocyte nuclear factor 4 

interferon regulatory factor 1 

interferon-stimulated response element 

LIM domain only 2 (rhombotin-like 1) 

MADS box transcription enhancer factor 2, polypeptide A 

(myocyte enhancer factor 2A) 

MADS box transcription enhancer factor 2, polypeptide A 
(myocyte enhancer factor 2A) . 
Myogenin (myogenic factor 4)/Neurofibromin 1 ■ 
NEUROFIBROMATOSIS, TYPE I 

?H 42 '' 2h f finger pr0tein 42 (myeloid-specific retinoic acid- 
responsive) 

fesponsive) 0 f ' n9er Pr ° t6in ^ (m y eloid - s P ecific ^inoic acid- 
NFE2; nuclear factor (erythroid-derived 2) 45kD 

SS,?* ' i9ht P0 ' VPeP,ide 9ene enh °™ >" B- 
nuclear factor of kappa light polypeptide gene enhancer in B- 
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cells p65 subunit 


NF-kappaB 


nuclear factor of kappa light polypeptide gene enhancer in B- 




cells 


NF-kappaB 


nuclear factor of kappa light polypeptide gene enhancer in B- 




cells 


NRSF 


NEURON RESTRICTIVE SILENCER FACTOR; REST; RE1- 




silencing transcription factor 


Oct-1 


OCTAMER-BINDING TRANSCRIPTION FACTOR 1; 




POU2F1; POU domain, class 2, transcription factor 1 


Oct-1 


OCTAMER-BINDING TRANSCRIPTION FACTOR 1; 




POU2F1; POU domain class 2. transcriDtion factor 1 


Oct-1 


OCTAMER-BINDING TRANSCRIPTION FACTOR 1; 




POU2F1; POU domain, class 2, transcription factor 1 


Oct-1 


OCTAMER-BINDING TRANSCRIPTION FACTOR 1; 




POU2F1; POU domain, class 2, transcription factor 1 


Oct-1 


OCTAMER-BINDING TRANSCRIPTION FACTOR 1; 




POU2F1; POU domain, class 2, transcription factor 1 


P300 

■ ^p* ^pj ^p* 


E1A (adenovirus E1A oncoprotein)-BINDING PROTEIN 

p^ppj • P m ■ ^pp ^P^ p » ^p* w ■ p ^pr pp^b p p m ^py ■ i ^pr npr ■ ^pr % * • w M pm^ • ■ ^ ■ ^ V V V ^tap^ ' 1 % ^^p^ P ■ ■ » « 




300-KD 


P53 


tumor protein p53 (Li-Fraumeni syndrome); TP53 


Pax-1 


paired box gene 1 


Pax-3 


paired box gene 3 (Waardenburg syndrome 1) 


Pax-6 


paired box gene 6 (aniridia, keratitis) 


Pbx 1b 


pre-B-cell leukemia transcription factor 


Pbx-1 


pre-B-cell leukemia transcription factor 1 


RORalpha2 


RAR-RELATED ORPHAN RECEPTOR ALPHA; RETINOIC 




ACID-BINDING RECEPTOR ALPHA 


RREB-1 


ras responsive element binding protein 1 


SP1 


simian-virus-40-protein-1 


SP1 


simian-virus-40-protein-1 


SREBP-1 


sterol regulatory element binding transcription factor 1 

%P* J Xp* 1 


SRF 


serum response factor (c-fos serum response element- 




binding transcription factor) 


SRY 


sex determining region Y 


STAT3 


signal transducer and activator of transcription 1, 91 kD 


Tal-1alpha/E47 


T-cell acute lymphocytic leukemia 1 /transcription factor 3 




(E2A immunoglobulin enhancer binding factors E12/E47) 


TATA 


cellular and viral TATA box elements 


Tax/CREB 


Transiently-expressed axonal glycoprotein/cAMP responsive 




element binding protein 


Tax/CREB 


Transiently-expressed axonal glycoprotein/cAMP responsive 




element binding protein 


TCF11/MafG 


v-maf musculoaponeurotic fibrosarcoma (avian) oncogene 




family, protein G 


TCF11 


Transcription Factor 11; TCF11; NFE2L1; nuclear factor 




(erythroid-derived 2)-like 1 


USF 


upstream stimulating factor 


Whn 


winged-helix nude 
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X - BF> - 1 X-box binding protein 1 Oder 

YY1 



ubiquitously distributed transcription factor belonging to 
theGLI-Kruppel class of zinc finger proteins 



bindet, derart chemisch behandelt wurde, daft an der 5'-Position unmethylierte 
Cytosinbasen in Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her 
dem Cytosin unahnliche Base verwandelt werden. 

In einer weiteren bevorzugten Variante des Verfahrens wird die Amplifikation mittels 
zweier Oligonukleotide oder zweier Klassen von Oligonukleotiden durchgefuhrt, von 
denen eines oder die eine Klasse die vier bis sechzehn Basen lange Sequenz enthalt, 
welche zu einer solchen DNA komplementar ist oder dieser entspricht, wie sie 
entstehen wurde. wenn ein ebenso langes DNA Fragment, welches Liber seine 
Sequenz oder Sekundarstruktur die spezifische Lokalisierung von 
Genom/Chromatinabschnitten innerhalb des Zellkerns herbeifuhren kann, derart 
chemisch behandelt wiirde, dali an der 5'-Position unmethylierte Cytosinbasen in 
Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her dem Cytosin 
unahnliche Base verwandelt werden. 



In einer weiteren bevorzugten Variante des Verfahrens wird die Amplifikation mittels 
zweier Oligonukleotide oder zweier Klassen von Oligonukleotiden durchgefuhrt, von 
denen eines oder die eine Klasse eine der Sequenzen 

TCGCGTGTA, TACACGCGA, TGTACGCGA, TCGCGTACA 
TTGCGTGTT, AACACGCAA, GGTACGTAA, TTACGTACC ' 
TCGCGTGTT, AACACGCGA, GGTACGCGA, TCGCGTACC 
TTGCGTGTA, TACACGCAA, TGTACGtAA, TTACGTACA ' 
TACGTG, CACGTA, TACGTG, CACGTA, 

ATTGCGTGT, ACACGCAAT, GTACGTAAT, ATTACGTAC 
ATTGCGTGA. TCACGCAAT, TTACGTAAT, ATTACGTAA ' 
ATCGCGTGA, TCACGCGAT, TTACGCGAT, ATCGCGTAA 
ATCGCGTGT, ACACGCGAT, GTACGCGAT, ATCGCGTAC 
TGTGGT, ACCACA, ATTATA, TATAAT 



TGAGTTAG, CTAACTCA, TTGATTTA, TAAATCAA 
TGATTTAG, CTAAATCA, TTGAGTTA, TAACTCAA, 
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TTTGGT, ACCAAA, ATT AAA, TTTAAT, 
TGTGGA, TCCACA, TTTATA, TATAAA , 
TTTGGA, TCCAAA, TTTAAA, TTTAAA, 
TGTGGT, ACCACA, ATTATA, TATAAT, 

ATTAT, ATAAT, GTAAT, ATTAC, 
ATTGT, ACAAT, GTAAT, ATTAC, 

GAAAG, CTTTC, I I I I I, AAAAA, 
GTAAT, ATTAC, ATTGT, ACAAT, 
GAAAT, ATTTC, ATTTT, AAAAT, 
GTAAG, CTTAC, TTTGT, ACAAA, 

TTAATAATCGAT, ATC GATTATTAA, ATCGATTATTGG, CCAATAATCGAT, 
ATCGATTA, TAATCGAT, TAATCGAT, ATCGATTA, 

ATCGATCGG, CCGATCGAT, TCGATCGAT, ATCGATCGA, 
ATCGATCGT, ACGATCGAT, GCGATCGAT. ATCGATCGC, 

TATCGATA, TATCGATA, TATCGGTG, CACCGATA, 
TATTAATA, TATTAATA, TATTGGTG, CACCAATA, 

GTGTAATATTT, AAATATTAC AC , GGGTATTGTAT, ATACAATACCC, 
GTGTAA Mill, AAAAATTACAC, GGGGATTGTAT, ATACAATCCCC, 
ATGTAAI I I I I, AAAAATTAC AT , GGGGATTGTAT, ATACAATCCCC, 
ATGTAATATTT, AAATATTAC AT, GGGTATTGTAT, ATACAATACCC, 
ATTACGTGGT, AC C AC GTAAT, ATTACGTGGT, ACCACGTAAT, 
TGACGTAA, TTACGTCA, TTACGTTA, TAACGTAA, 
TGACGTTA, TAACGTCA, TGACGTTA, TAACGTCA, 
TTACGTAA, TTACGTAA, TTACGTAA, TTACGTAA, 
TGACGTTA, TAACGTCA, TAACGTTA, TAACGTTA, 

* 

TGACGT, ACGTCA, GCGTTA, TAACGC, 
TGACGT, ACGTCA. ACGTTA, TAACGT, 
TTTCGCGT, ACGCGAAA, GCGCGAAA, TTTCGCGC, 
TTTGGCGT, ACGCCAAA, GCGTTAAA, TTTAACGC, 

TAGGTGTTA, TAACACCTA, TAATATTTG, CAAATATTA, 
TAGGTGTTT, AAACACCTA, GAATATTTG, CAAATATTC, 

GTAGGTGG, CCACCTAC, TTATTTGT, ACAAATAA, 
GTAGGTGT, ACACCTAC, ATATTTGT, ACAAATAT, 

TGCGTGGGCGG, CCGCCCACGCA, TCGTTTACGTA, TACGTAAACGA, 
TGCGTGGGCGT, ACGCCCACGCA, ACGTTTACGTA, TACGTAAACGT, 

TGCGTAGGCGT, ACGCCTACGCA, ACGTTTACGTA, TACGTAAACGT, 
TGCGTAGGCGG, CCGCCTACGCA, TCGTTTACGTA, TACGTAAACGA, 
ATAGGAAGT, ACTTCCTAT, ATTTTTTGT, ACAAAAAAT, 
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TCGGAAGT, ACTTCCGA, ATTTTCGG, CCGAAAAT 
TCGGAAGT, ACTTCCGA, GTTTTCGG, CCGAAAAC 
TCGGAAAT, ATTTCCGA, ATTTTCGG, CCGAAAAT ' 
TCGGAAAT, ATTTCCGA, GTTTTCGG, CCGAAAAC 
GTAAATAA, TTATTTAC, TTGTTTAT, ATAAACAA, ' 
GTAAATAAATA, TATTTATTTAC, TGTTTATTTAT, ATAAATAAACA, 

AAAGTAAATA, TATTTACTTT, TGTTTATTTT, AAAATAAACA 
^IS^I A ' TATTTACATT, TGTTTATATT, AATATAAACa' 

TATTTACTTA . TGTTTATTTA, TAAATAAACA 
TATGTAAATA, TATTTACATA, TGTTTATATA, TATATAAACA, 

ATAAATA, TATTTAT, TGTTTAT, ATAAACA 
ATAAATA, TATTTAT, TATTTAT, ATAAATA 
GATA, TATC, TATT, AATA, 

TAGATAA, TTATCTA, TTATTTG, CAAATAA 
TTGATAA, TTATCAA, TTATTAG, CTAATAA 
GATAA, TTATC, TTATT, AATAA, 

GATG, CATC, TATT, AATA, 

GATAG, CTATC, TTATT, AATAA 
GATAAG, CTTATC, TTTATT, AATAAA, 

IS™™' I^T^CA' TAAATAAATA, TATTTATTTA, 
TGTTTGTTTA, TAAACAAACA, TAAATAAATA TATTTATTTA 
I A EI ATTTA . TAAATAAATA, TAAATAAATA, TATTTATTTA 
TATTTGTTTA, TAAACAAATA, TAAATAAATA, TATTTATTTA, 

2H^ A I? ATT ' AATCATTAAC, AATTATTAAT, ATTAATAATT 
GTTAATTATT, AATAATTAAC, AATAATTAAT, ATTAATTATT ' 
r™I^I' ATTAATTAAC, ATTAATTAAT. ATTAATTAAT 
GTTAATGAAT, ATTCATTAAC, A TTTATT AAT, ATTAATAAAT, 

TAAAGTTTA, TAAACTTTA, TGAATTTTG, CAAAATTCA 
TAAAGGTTA, TAACCTTTA, TGATTTTTG, CAAAAATCA, 

AAAGTGAAATT, AATTTCACTTT, GGTTTTATTTT AAAATAAAArr 
AAAGCGAAATT, AATTTCGCTTT, G GTTTC GTTTT ,^^A^!cGAAAC C 

CM^ TCACTTtS GGGAAAGTGAAATTG, 

cmttTca^ ggaaaagtgaaattg, 

CMTTrCTCTm GGAAAAGAGAAATTG, 
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TAGTTTI I I I I I I I I, AAAAAAAAAAAACTA, GGGAAAGAGAAATTG, 

CAATTTCTCTTTCCC, 

TAGGTG, CACCTA, TATTTG, CAAATA, 

TTTTAAAAAT AATTTT , AAAATT ATTTTT AAAA , AGGGTTAI I I I IAGAG, 
CTCTAAAAATAACCCT 

TTTTAAAAAT AATTTT , AAAATT ATTTTT AAAA , GGAGTTA I I I I IAGAG, 
CTCTAAAAATA ACTCC , 

TTTTAAAAAT AATTTT , AAAATTA I I I I I AAAA , AGAGTTA I I I I IAGAG, 
CTCT AAAAATA ACTCT , 

TTTTAAAAAT AATTTT , AAAATT ATTTTT AAAA, GGGGTTA I I I I IAGAG, 
CTCTAAAAATAACCCC, 

TGTTATTAAAAATAGAAA, TTTCTA I I I I I AATAACA, 
I I II IAI I I I I AGTAATA, TATTACTAAAAATAAAAA, 
TGTTATTAAAAATAGAAT , ATTCTA I I II I AATAACA, 
GTTTTATTTTTAGTAATA, TATTACTAAAAATAAAAC, 
TTTGGTAT, ATACCAAA, GTGTTAAA, TTTAACAC 
GGGGA, TCCCC, I I I I I, AAAAA, 

TAGGGG, CCCCTA, I I I I I A, T AAAAA, 
GAGGGG, CCCCTC, I I I I I I. AAAAAA, 

TGTTGAGTTAT, ATAACTCAACA, ATG ATTTAGTA , TACTAAATCAT, 
TGTTG ATTTAT , ATAAATCAACA, GTG AGTTAGTA , TACTAACTCAC, 
TGTTGAGTTAT, ATAACTCAACA, ATG ATTTAGTA , TACTAAATCAT, 
TGTTG ATTTAT , ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC, 
GGGGATTTTT, AAAAATCCCC, GGGAAI I I I I, AAAAATTCCC, 
GGGGATTTTT, AAAAATCCCC, GGGGATTTTT, AAAAATCCCC, 
GGGGA Mill, AAAAATCCCC, GGAAAI I I I I, AAAAATTTCC, 
GGGAA TTTT T, AAAAATTCCC, GGAAA Mill, AAAAATTTCC, 
GGGAATTTTT, AAAAATTCCC, GGAAA Mill, AAAAATTTCC, 
GGGAT TTTTT , AAAAAATCCC, GGAAAGTTTT, AAAACTTTCC, 
GGGAATTTTT, AAAAATTCCC, GGGAATTTTT, AAAAATTCCC, 
GGGATTTTTT, AAAAAATCCC, GGGAAGTTTT, AAAACTTCCC, 
GGGAI II I I IA, TAAAAAATCCC, TGGAAAGTTTT, AAAACTTTCCA, 
TTTAGTATTACGGATAGAGGT, ACCTCTATCCGTAATACTAAA, 
GTTTTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAAAAAC, 
TT TAGTA TTACGGATAGAGTT, AACTCTATCCGTAATACTAAA, 
G GTTTTGTTC GTGGTGTTG AA, TTCAACACCAC G AAC AAAAC C , 
TTTAGTATTACGGATAGCGTT, AACGCTATCCGTAATACTAAA, 
GGCGTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAACGCC, 
TTTAGTATTACGGATAGCGGT, ACCGCTATCCGTAATACTAAA, 
GTCGTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAACGAC, 

ATATGTAAAT, ATTTACATAT, ATTTGTATAT, ATATACAAAT, 
TTATGTAAAT, ATTTACATAA, ATTTGTATAA, TTATACAAAT, 



GAATATTTA, TAAATATTC, TGAATATTT, AAATATTCA, 
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■ 

GAATATGTA, TACATATTC, TGTATATTT, AAATATACA, 

ATAAT, ATTAT, ATTAT, ATAAT 
GTAAT, ATTAC, ATTAT, ATAAT, 

AATGTAAAT, ATTTACATT, ATTTGTATT, AATACAAAT, 

JSS ^I^S^ T ' GGT ATGTAAAT, ATTTACATACC, 
ATTTGTATATT, AATATACAAAT, AATATGTAAAT ATTTACATATT 
ATTTGTATATT, AATATACAAAT, AGTATGTAAAT ATTTACATACT 
ATTTGTATATT, AATATACAAAT, GATATCTAAAT,' ATTTACAWC: 

AGGAGT, ACTCCT, ATTTTT, AAAAAT 
GGGAGT, ACTCCC, ATTTTT, AAAAAT 
GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCP 

^TATGTTCGGCTATGm: AAACAl^cd^STO' 
GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC 

tcgt^cJ 7 ^^^ aaacatacccgmc^ct; 

I? ? TT CGTTTTAGATAT ' ATATCTAAAACGAAACGA 
ATATTTAGAGC G G AACG G , CCGTTCCGCTCTAAATAT, 

CGTTACGGTT, AACCGTAACG, AATCGTGACG CGTCACGATT 

cg^c^'^S^ gat cgtgacg: CGTCACGATC, 

rrS^SS' ^£2™°°' AAGCGTGACG, CGTCACGCTT 
CGTTACGTTT, AAACGTAACG, GAGCGTGACG, CGTCACGCTC, 

in A S G I A J GA ' TCATACGTAAA, TTATGCGTGAA, TTCACGCATAA 
m AGG III GA - TCAAACGTAAA, TTAAGCGTGAA TTCACGCTTAa' 
TTTACGTTTTA, TAAAACGTAAA, TGAAGCGTGAA TTC A C GCTTPA 
TTTAC GTATTA , TAATACGTAAa! TGATGcS,' tTcacIcaTcA,' 

' J™"™^. TTGATTGATT, AATCAATCAA, 
TATTAATTAA, TTAATTAATA, TTGATTGATG, CATCAATCAA, 

TAATTAT, ATAATTA, ATGATTG, CAATCAT, 
TAGGTTA, TAACCTA, TGATTTA, TAAATCA, 

C^C^CA^CC^ TAmA ^' GGGGG T G TTTGGGG. 
CCXC^ T JcAC^C^ TM ^ TAAM ' GGGGTGGTT TGGGG, 
^^^^CC^^^^' GGGGGGGTTTGG GG, 

oS^mS^Sc^™^^ ggggttgtttgggg, 

GAGGCGGGG, CCCCGCCTC, TTTCGTTTT, AAAACGAAA, 
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GAGGTAGGG, CCCTACCTC, TTTTGTTTT, AAAACAAAA, 
AAGGCGGGG, CCCCGCCTT, TTTCGTTTT, AAAACGAAA, 
AAGGTAGGG, CCCTACCTT, TTTTGTTTT, AAAACAAAA, 

GGGGGCGGGGT, ACCCCGCCCCC, ATTTCG TTTTT , AAAAACGAAAT, 
GGGGGCGGGGT, ACCCCGCCCCC, GTTTCG Mill, AAAAAC G AAAC , 
TATTATTTTAT, ATAAAATAATA, GTGGGGTGATA, TATCACCCCAC, 
GATTATTTTAT, ATAAAATAATC, GTGGGGTGATT, AATCACCCCAC, 

ATTACGTGAT, ATCACGTAAT, ATTACGTGAT, ATCACGTAAT, 
ATTACGTGAT, ATCACGTAAT, GTTACGTGAT, ATCACGTAAC, 

TTTTATATGG, CCATATAAAA, TTATATAAGG, CCTTATATAA, 
TTATATATGG, CCATATATAA, TTATATATGG, CCATATATAA, 
AAATAAT, ATTATTT, GTTGTTT, AAACAAC, 
AAATTAA, TTAATTT, TTAGTTT, AAACTAA, 
AAATTAT, ATAATTT, GTAGTTT, AAACTAC, 
AAATAAA, TTTATTT, TTTGTTT, AAACAAA, 

A I I I I I CGGAAATG, CATTTCCGAAAAAT, TATTTTCGGGAAAT, 
ATTTCCCGAAAATA, 

A I I I I I CGGAAATG, CATTTCCGAAAAAT, TATTTTCGGGAAAT, 
ATTTCCCGAAAATA, 

ATTTTCGGGAAATG, CATTTC CC G AAAAT , TA I I I I I CGGAAAT, 
ATTTCCGAAAAATA, 

ATTTTCGGGAAGTG, CACTTCCCGAAAAT, TATTTTTC G G AAAT , 
ATTTCCGAAAAATA, 

AATAGATGTT, AACATCTATT, AATATTTGTT, AACAAATATT. 
AATAGATGGT, ACCATCTATT, ATTATTTGTT, AACAAATAAT, 

GTATAAATA, TATTTATAC, TATTTATAT, ATATAAATA, 
GTATAAATG, CATTTATAC, TATTTATAT, ATATAAATA, 
GTATAAAAA, I I I I IATAC, TTTTTATAT, ATATAAAAA, 
GTATAAAAG, CTTTTATAC, TTTTTATAT, ATATAAAAA, 
TTATAAATA, TATTTATAA, TATTTATAG, CTATAAATA, 
TTATAAATG, CATT TATAA, TATTTATAG, CTATAAATA, 
TTATAAAAA, TTTTTATAA, I I I I IATAG, CTATAAAAA, 
TTATAAAAG, CTTTTATAA, I I I I IATAG, CTATAAAAA, 
GGGGGTTGACGTA, TACGTCAACCCCC, TGCGTTAA Mill, 
AAAAATTAACGCA, 

GGGGGTTGACGTA, TACGTCAACCCCC, TACGTTAATTTTT, 
AAAAATTAACGTA, 

TGACGTATA Mill, AAAAATATACGTCA, GGGGATATGCGTTA, 
TAACGCATATCCCC, 

TGACGTATATTTTT, AAAAATATACGTCA, GGGGGTATGCGTTA, 
TAACGCATACCCCC, 



WO 01/42493 

* 



24 



PCT/DEOO/04381 



GTTAT^ATMC,' TGTTGAGTTAT, ATAACTCAACA, 

TTACGTGA, TCACGTAA, TTACGTGG, CCACGTAA 
TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA 
TTACGTGG, CCACGTAA, TTACGTGA, TCACGTAA 
TTACGTGA, TCACGTAA, TTACGTGA, TCACGTAA ' 
GACGTT, AACGTC, AGCGTT, AACGCT, 

TGACGTGT, ACACGTCA. ATACGTTA, TAACGTAT 
TGACGTGG, CCACGTCA, TTACGTTA, TAACGTAA 
CGGTTATTTTG, CAAAATAACCG, TAAGATGGTCG Oder CGACCATCTTA 

enthalt, welche zu einer solchen DNA komplementar ist oder dieser entspricht, wie sie 
entstehen wiirde, wenn ein ebenso langes DNA Fragment, welches iiber seine 
Sequenz oder Sekundarstruktur die spezifische Lokalisierung von 
Genom/Chromatinabschnitten innerhalb des Zellkems herbeifiihren kann, derart 
chemisch behandelt wiirde, da& an der S'-Position unmethylierte Cytosinbasen in 
Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her dem Cytosin 
unahnliche Base verwandelt werden. 

In einer besonders bevorzugten Variante des Verfahrens enthalten die zur Amplifikation 
verwendeten Oligonukleotide auBer den oben definierten Konsensussequenzen 
mehrere Positionen, an denen entweder irgendeine der drei Basen G, A und T oder 
irgendeine der Basen C, A und T vorhanden sein kann. 

* 

In einer besonders bevorzugten Variante des Verfahrens enthalten die zur Amplifikation 
verwendeten Oligonukleotide auGer einer der oben beschriebenen Konsensus- 
sequenzen nur maximal zusatzlich so viele weitere Basen, wie es zur gleichzeitigen 
Amplifikation von mehr als einhundert verschiedenen Fragmenten pro Reaktion aus der 
chemisch wie oben behandelten DNA erforderlich ist. 

In einem dritten Verfahrensschritt wird nun der Sequenzkontext aller oder eines Teils 
der in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide oder CpNpG 
Trinukleotide untersucht. 
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In einer besonders bevorzugten Variante des Verfahrens erfolgt die Analyse durch 
Hybridisierung der bereits in der Amplifikation mit einem Fluoreszenzmarker 
versehenen Fragmente an einen Oligonukleotid- Array (DNA Chip). Der 
Fluoreszenzmarker kann entweder uber die verwendeten Primer oder aber durch ein 
fluoreszenzmarkiertes Nukleotid (z. B. Cy5-dCTP, kommerziell von Amersham- 
Pharmacia erhaltlich) eingefiihrt werden. 

Dabei hybridisieren komplementare Fragmente an die jeweiligen auf der 
Chipoberflache immobilisierten Oligomere, nicht komplementare Fragmente werden in 
einem oder mehreren Waschschritten entfernt. Die Fluoreszenz an den jeweiligen 
Hybridisierungsorten auf dem Chip erlaubt dann den Ruckschluft auf den 
Sequenzkontext der in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide 
oder CpNpG Trinukleotide. 

In einer weiteren bevorzugten Variante des Verfahrens werden die amplifizierten 
Fragmente auf einer Oberflache immobilisiert und anschlieSend eine Hybridisierung mit 
einer kombinatorischen Bibiliothek von unterscheidbaren Oligonukleotid- oder PNA- 
Oligomer-Sonden durchgefuhrt. Wiederum werden nicht komplementare Sonden durch 
einen oder mehrere Waschschritte entfernt. Die hybridisierten Sonden werden 
entweder uber ihre Fluoreszenzmarker detektiert oder in einer weiteren besonders 
bevorzugten Variante des Verfahrens mittels Matrix-assistierter Laser- 
Desorptions/lonisations Massenspektrometrie (MALDI-MS) anhand ihrer eindeutigen 
Masse nachgewiesen. Dabei werden die Sondenbibliotheken derart synthetisiert, daB 
die Masse eines jeden Bestandteils eindeutig seiner Sequenz zugeordnet werden kann. 

Die Amplifikate konnen zudem in einer weiteren bevorzugten Variante des Verfahrens 
hinsichtlich Ihrer durchschnittlichen GrbBe durch Veranderung der 
Kettenverlangerungszeiten im Amplifikationsschritt beeinflu&t werden. Da hier 
vorwiegend kleinere Fragmente (ca. 200-500 Basenpaare) untersucht werden, ist eine 
Verkurzung der Kettenverlangerungsschritte z. B. einer PCR sinnvoll. 

In einer weiteren bevorzugten Variante des Verfahrens werden die Amplifikate durch 
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Gelelektrophorese aufgetrennt, und die Fragmente im gewQnschten GrdRenbereich 
werden vor Ihrer Analyse ausgeschnitten. In einer weiteren besonders bevorzugten 
Variante werden die aus dem Gel ausgeschnittenen Amplifikate unter Verwendung des 
gleichen Satzes an Primern erneut amplifiziert. Dabei kdnnen dann nur noch 
Fragmente der gewQnschten Grofce entstehen, da Andere als Templat nicht mehr 
verfugbar sind. 

4 

Ein weiterer Gegenstand der vorleigenden Erfindung ist ein Kit, enthaltend mindestens 
zwei Primerpaare, Reagenzien und Hilfsstoffe fur die Amplifikation und/oder 
Reagenzien und Hilfsmittel fur die chemische Behandlung und/oder eine 
kombinatorische Sondenbibliothek und/oder einen Oligonukleotid-Array (DNA-Chip), 
soweit sie fur die Durchfuhrung des erfindungsgemaBen Verfahrens erforderlich oder 
dienlich sind. 1 

Die folgenden Beispiele erlautern die Erfindung. 

Beispiele: 
Beispiel 1 : 

Primer zur bevorzugten Amplifikation von CG reichen Regionen im Humangenom 

Bei den CG reichen Regionen im Humangenom handelt es sich urn sogenannte CpG- 
islands, die eine regulatorischen Funktion besitzen. Wir definieren CpG Islands derart, 
dass sie mindestens 500 bp umfassen sowie einen GC-Gehalt von >50% aufweisen 
ausserdem ist der Quotient CG/GC > 0,6. Unter diesen Bedingungen liegen 16 Mb als 
CpG Islands vor. Damit liegen etwa 0,5 % der Genomsequenz in diesen CpG islands, ' 
wenn man auch noch jeweils eine Region bis 1000 bp downstream zusatzlich 
betrachtet. Dieser Uberlegung liegen Daten aus der Ensembl Database vom 31.10.00, 
Quelle Sanger Centre, zugrunde. Die dort verfugbare Sequenz umfasste ca. 3,5 GB, 
und fur die Berechnungen wurden die Repeats maskiert. 

Statistisch ware es bei 12meren zu erwarten, dass sie nur 0,005 mal so haufig an eine 
der CG-reichen Regionen hybridisieren wie an eine andere beliebige Region im 
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Genom. Es wurden nun Primer gefunden, welche 1 ,8 mal haufiger an eine CG reiche 
Region binden. Zudem ergibt sich mit den entsprechend gefundene Reverse Primer 
nahezu eine Spezifitat fUr diese CpG islands. 

In diesem Beispiel sind die Primer AGTAGTAGTAGT (Seq. ID 1) AAAACAAAAACC 
(Seq. ID 2) und alternativ AGTAGTAGTAGT (Seq. ID 19) und ACAAAAACTAAA (seq. 
ID 20). Das erste Primerpaar fuhrt mindestens zu den Amplifikaten Seq. ID 3 bis 18, 
das zweite Primerpaar zu den Amplifikaten der Seq. ID 21 bis 31. 



Beispiel 2: 

Berechnung der Vorhersage der Anzahl von Amplifikaten in Genomischen Regionen. 

GemaS Anspruch 8 im Patent wird gezeigt mehr als doppelt so viele Amplifikate 
erstellen zu konnen, als es statistisch zu erwarten ware nach Formel 1. 

w rWr* X ( P fl ( ) ) A> 

F=N*P s (Primers) pfp , rr [{\-P a {Primers)) M -\) 

log(l - P a \Primers)) ° J 

(P (Primers)) Formel 1. 

F gibt dabei die Anzahl der Vorhergesagten Amplifikate an, die zu erwarten sind, wenn 
man N Basen als Datenbasis aus dem Genom betrachtet. P ist die jeweilige 
Wahrscheinlichkeit fur die Hybridisierung eines Primeroligonukleotids, getrennt nach 
Hybridisierung im Sense- und Antisense-Strang. M ist die maximal zulassige Lange der 
zu erwartenden Amplifikate. 

Die Wahrscheinlichkeit P wird bestimmt durch eine Markov Kette erster Ordnung. Dabei 
wird die Annahme gemacht, dass die DNA eine Zufallsfolge in Abhangigkeit 
benachbarter Basen ist. Fur die Berechnung einer Markovkette sind die 
Ubergangswahrscheinlichkeiten von benachbarten Basen notwendig. Diese wurden 
empirisch aus 12% des assemblierten humanen Genoms, das vollstandig mit Bisulfit 
behandelt wurde, ermittelt und in Tabelle 1 zusammengefasst. In Tabelle 2 sind die 
Ubergangswahrscheinlichkeiten fur den entsprechenden komplementar reversen 



WO 01/42493 



PCT/DEOO/04381 



28 

Strang angegeben. Diese ergeben sich durch einfaches Vertauschen der Eintrage aus 
der Tabelle 1 . 



Tabelle 1 



Von\nach 


A 


C 


G 


7 


A 


0.0894 


0.0033 


0.0722 


0.1162 


C 


0.0 


0.0 


0.0140 


0.0 


G 


0.0603 


0.0036 


0.0601 


0.0959 


T 


0.1314 


0.0071 


0.0736 


0.2729 



mit 

^W,U)=0.2811 
^WC)=0.0140 

^WG)=0.2199 
JW)»0.4850 

und fQr den dazu revers-komplementaren Strang (durch entsprechendes Austauschen 
der Eintrage) P riDNA ( von ; nach ) 



Tabelle 2 



Von\nach 


A 


C 


G 


T ■ 


A 


0.2729 


0.0959 


0.0 


0.1162 


C 


0.0736 


0.0601 


0.0140 


0.0722 


G 


0.0071 


0.0036 


0.0 


0.0033 


T 


0.1314 


0.0603 

. 


0.0 


0.0894 



^ 4 d»,U)=0.4850 

p rbDM [c)=o.2m 

^dm(<?)=0.0140 
^Wn=0.2811 



Damit hangt die Wahrscheinlichkeit, dass sich fur einen Primer PrimE (mit der 
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Basenfolge Bi B 2 B 3 B 4 z.B. ATTG...) eine perfekte Basenpaarung ergibt, von der 
genauen Abfolge der Basen ab und ergibt sich als das Produkt: 

P (P*.;™r\-P i P \ P rbDNA(B\> %i) ^rbDNA^7> ^ z) ? rbDN A^ 3 >' & 4) 

P 35 {PnmE)-P rbDNA {B x )— — — — — ... 

r rbDNA\ G \) r rbDNA\ D 2) r rbDNA\ D V 

(Bisulfit-DNA-Strang) 

P }Q [PrimE)-P bDNA {B,)— — — - — — ... 

r bPNA\^\) r bDNA {ti 2 ) PbPNA^l) 

(anti-sense-Strang zu einem Bisulfit-DNA-Strang); 
fur einen Primer Prim auf dem sense-Strang ergeben sich 

N*P s {Prim) 

perfekte Basenpaarungen - Werden mehrere Primer (PhmU t PrimV, PrimW, PrimX, 
etc.) gleichzeitig verwendet, ergibt sich als Wahrscheinlichkeit fur eine perfekte 
Basenpaarung auf dem sense-Strang an einer gegebenen Position: 

P s ( Primers )=P S { Prim U ) 

+( 1 - P s {PrimU)) P s {Prim V ) 

+{\-P s {PrimV)){\-P s {PrimV))P 5 {PrimW) 

H\-P,{PrimU)){l-P s {frimV)){l-P M {MmW))P 

+ ... 

(PrimU, PrimV, PrimW... sind hier verschiedene Primer mit unterschiedlichen 
Basenpaarungen) 

und damit als Anzahl der zu erwartenden perfekten Basenpaarungen mit irgendeinem 
der Primer 

N *P 5 {Primers) , 

Fur die Bestimmung von P a (Primer$) auf dem anti-sense-Strang werden die analogen 
Gleichungen verwendet. 

Fur das Beispiel mit zwei Primern (einem sense-Primer und einem antisense-Primer) 
ergeben sich folgende Wahrscheinlichkeiten: 

P(AGTAGTAGTAGT) = 0.000000860027 
P(AACAAAAACTAA) = 0.000030005828 

Auf den CpG-lslands, die insgesamt ca. 30.000.000 Basen enthalten, erwartet man 
eine Haufigkeit von Hybridisierungen fur: 
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AGTAGTAGTAGT: 25.80 auf dem sense Strang 

AACAAAAACTAA: 900.17 auf dem komplementar reversen Strang. 

Auf den jeweils anderen Strangen konnen die Primer nicht hybridisieren, da auf dem 

sense-Strang durch die Bisulfrtbehandlung keine Cs aufcerhalb des Kontextes CG 

auftreten und entsprechend komplementar auf dem antisense-Strang. 

Ein Amplifikat entsteht genau dann, wenn bei einer perfekten Basenpaarung auf dem 
sense-Strang innerhalb der maximalen Fragmentlange M ein Primer auf dem 
Gegenstrang eine perfekte Basenpaarung bildet, die Wahrscheinlichkeit dafur ist 

, Pa(Primers)X i=Q (I- P .(Primers))' ' 

fur grofce M und kleine P a (Primers) wird dieses durch folgenden Ausdruck berechnet: 

P Q {Primers) 
log ( 1 -P a (Primers)) [( 1 ~ P ' i**™))" " ' 1 ; 

fur die Gesamtzahl F der Amplifikate, die durch die Amplifikation beider Strange zu 
erwarten sind, ergibt sich damit 

c—A/u-D/n- \ (P .(Primers)) 
+ a/*p/p- i ('.(Primers)) , F ° rmel 1 

FQr das oben angegebene Beispiel ergeben sich fur die CpG-lslands mit 30 Mega 
Basen 3.0498 Amplifikate. Wir konnen jedoch zeigen (siehe Beispiel 1), dass man mit 
Primern, die fur bestimmte Regionen spezifisch sind, mehr als statistisch vorhergesagte 
Amplifikate erzeugen kann. 
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Patentanspruche 

LVerfahren zur parallelen Detektion des Methylierungszustandes von genomischer 
DNA, dadurch gekennzeichnet, daB man folgende Schritte ausfuhrt: 

a) in einer genomischen DNA Probe wandelt man durch chemische Behandlung an 
der 5'-Position unmethylierte Cytosinbasen in Uracil, Thymidin Oder eine andere vom 
Hybridisierungsverhalten her dem Cytosin unahnliche Base urn; 

b) aus dieser chemisch behandelten genomischen DNA amplifiziert man mehr als 
zehn unterschiedliche Fragmente, die jeweils weniger als 2000 Basenpaare lang 
sind, gleichzeitig durch Verwendung von synthetischen Oligonukleotiden als Primer, 
wobei diese Primer jeweils Sequenzen aus an der Genregulation beteiligten 
und/oder transkribierten und/oder translatierten genomischen Sequenzen enthalten, 
wie sie nach einer Behandlung gemafJ Schritt a) vorliegen wurden; 

c) man bestimmt den Sequenzkontext aller oder eines Teils der in den amplifizierten 
Fragmenten enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daft man die chemische 
Behandlung mittels einer Losung eines Bisulfits, Hydrogensulfits oder Disulfits 
durchfuhrt. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daB mindestens eines 
der in Schritt b) verwendeten Oligonukleotide weniger Nukleobasen enthalt als es 
statistisch fur eine sequenzspezifische Hybridisierung an die chemisch behandelte 
genomische DNA Probe erforderlich ware. 

4. Verfahren nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, dafi 
mindestens eines der in Schritt b) des Anspruchs 1 verwendeten Oligonukleotide 
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kurzer als 18 Nukleobasen ist. 

5. Verfahren nach einem der Anspruche 1 bis 3, dadurch gekennzeichnet, daB 
mindestens eines der in Schritt b) des Anspruchs 1 verwendeten Oligonukleotide 
kurzer als 15 Nukleobasen ist. 

6. Verfahren nach Anspruch 1 Oder 2, dadurch gekennzeichnet, daB man in Schritt b) 
des Anspruchs 1 mehr als 4 verschiedene Oligonukleotide gleichzeitig fur die 
Amplifikation verwendet. 

7. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daB man in Schritt b) 
des Anspruchs 1 mehr als 26 verschiedene Oligonukleotide gleichzeitig fur die 
Amplifikation verwendet. 

8. Verfahren nach einem der vorangehenden Anspruche, dadurch gekennzeichnet. daB 
in Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
nach berechnet nach Formel 1 aus an der Regulation von Genen beteiligten 
Genomabschnitten, wie Promotoren und Enhancern, stammt, als bei einer rein 
zufalligen Wahl der Oligonukleotidsequenzen zu erwarten ware, oder aber deren 
Anteil an den insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist 
wie berechnet nach Formel 1 , 



w ^ ^s «'-^-'i ° ,mel1 

wobei man die Berechnung wie folgt durchfuhrt: 

bei der mit Bisulfit behandelten DNA kann C nur noch im Kontext CG auftreten, 
so wird angenommen, daB die primare DNA eine Zufallsfolge mit Abhangigkeit 
direkt benachbarter Basen ist (Markov-Kette erster Ordnung); die empirisch aus 
der Datenbank (vollstandig methyliert; mit Bisullfit behandelt) ermittelten 
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paarweisen Basenwahrscheinlichkeiten ergeben sich gleich fur beide DNA- 

Strange als P bDNA {von;nach) aus der folgenden Tabelle: 



Von\nach 


A 


C 


G 


7 


A 


0.0894 


0.0033 


0.0722 


0.1162 


C 


0.0 


0.0 


0.0140 


0.0 


G 


0.0603 


0.0036 


0.0601 


0.0959 


T 


0.1314 


0.0071 


0.0736 


0.2729 



mit 



P bDNA {A)=02&\\ 
/WC)=0.0140 
P bDNA (G)=0.2\99 
P KWM (7 , )=0.4850 



und for den dazu revers-komplementaren Strang (durch entsprechendes 
Austauschen der Eintrage) P r bDNA( von - nach) 



Von\nach 


A 


C 


G 


T 


A 


0.2729 


0.0959 


0.0 


0.1162 


C 


0.0736 


0.0601 


0.0140 


0.0722 


G 


0.0071 


0.0036 


0.0 


0.0033 


T 


0.1314 


0.0603 


0.0 


0.0894 



i>, im< M)=0.4850 

/\ iD M,(C)=0.2199 
/ > r4D « M (G)=0.0140 

p rbDNA {T)=o.2m 

;damit hangt die Wahrscheinlichkeit, daB sich fur einen Primer PrimE (mit der 
Basenfolge Bi B 2 B 3 B 4 z.B. ATTG...) eine perfekte Basenpaarung ergibt, von 
der genauen Abfolge der Basen ab und ergibt sich als das Produkt: 
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P u ( PrimE ) = P rbom ( B , ) ^^"'^ P r b pN A (B 2 ; B % ) ^Wga^gJ 

^^1) P rm N AB 2 ) P rbDNA {B,) ••' 

(Bisulfit-DNA-Strang) 

P Ja ( W»£ }~ P bDNA (P)) PbDN ^ Bl ' B J P bDNA(B l ;B i ) P bDNA {B,;B 4 ) 

PumW P tDNA (B 2 ) P bDNA (B 3 ) '•• 
(anti-sense-Strang zu einem Bisulfit-DNA-Strang); 
fur einen Primer Pr/m auf dem sense-Strang ergeben sich 

N*P x {Prim) ; 

perfekte Basenpaarungen - Werden mehrere Primer (PrimU, PrimV, PrimW, 
PrimX, etc.) gleichzeitig verwendet, ergibt sich als Wahrscheinlichkeit fur eine 
perfekte Basenpaarung auf dem sense-Strang an einer gegebenen Position: 

P s {Primers)=PXPrimU) 

+(\- P, (PrimU)) P t (PrtmV) 
+(\-P,{PrimU))(\ -P,(PrimV))P,(PrimW) 

H\-P.APrimU))(l-P s (PrimVm\-P f (p rim iv))P s (p rim x) 
+ ... 

und damit als Anzahl der zu erwartenden perfekten Basenparungen mit 
irgendeinem der Primer 

N * P XPrimers) ; 

fur die Bestimmung von P a (Primers) auf dem anti-sense-Strang werden die 
analogen Gleichungen verwendet; ein Amplifikat entsteht genau dann, wenn bei 
einer perfekten Basenpaarung auf dem sense-Strang innerhalb der maximalen 
Fragmentlange M ein Primer auf dem Gegenstrang eine perfekte Basenpaarung 
bildet, die Wahrscheinlichkeit dafur ist 



P o (Primers)2^ ia0 (l-PJPrimers)) 1 '< 

fur grolie M und kleine P a (Primers) wird dieses durch folgenden Ausdruck 
berechnet: 

P 0 {Pr inters) 
\og{\-PSPri m ers)) [{l - P ^ Primers ^-^ ' 

fur die Gesamtzahl F der Amplifikate, die durch die Amplifikation beider Strange 
zu erwarten sind, ergibt sich damit 



1 
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F=N*P A .{Primers) 



{P a {Primers)) 



[{l-P a {Primers)) M -l] 



+ N *P a {Primers) 



log(l-P„( Primers)) 
(P s ( Primers)) 



[(l-P s (Primers)) M -l] 



Formel 1 



log(l -P s {Primers)) 



9. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, daft in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus Genomabschnitten stamrnt, die in 
mindestens einer Zelle des jeweiligen Organismus in mRNA transkribiert werden, als 
bei einer rein zufalligen Wahl der Oligonukleotidsequenzen zu erwarten ware, oder 
aber deren Anteil an den insgesamt nachweisbaren Fragmenten mehr als doppelt so 
hoch ist als berechnet entsprechend Anspruch 8. 

10. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, dafc in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus nach der Transkription in mRNA 
gespliceten Genomabschnitten (Exons) stamrnt, als bei einer rein zufalligen Wahl 
der Oligonukleotidsequenzen zu erwarten ware, oder aber deren Anteil an den 
insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet 
entsprechend Anspruch 8. 

11. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, daft in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus Genomabschnitten stammen, welche fur 
Teile einer oder mehrerer Genfamilien kodieren, als bei einer rein zufalligen Wahl 
der Oligonukleotidsequenzen zu erwarten ware, oder aber deren Anteil an den 
insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet 
entsprechend Anspruch 8. 

12. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet, daft in 
Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8. aus Genomabschnitten stammen, welche fur 
sogenannte ..matrix attachment sites" (MARs)- charakteristische Sequenzen 
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enthalten, als bei einer rein zufalligen Wahl der Oligonukleotidsequenzen zu 
erwarten ware, Oder aber deren Anteil an den insgesamt nachweisbaren Fragmenten 
mehr als doppelt so hoch 1st als berechnet entsprechend Anspruch 8. 

13. Verfahren nach einem der Anspruche 1 bis 7, dadurch gekennzeichnet dafJ in 
Schntt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus Genomabschnitten stammen, welche als 
sogenannte ..boundary elements" die Verpackungsdichte des Chromatins 
organ.s,eren. als bei einer rein zufalligen Wahl der Oligonukleotidsequenzen zu 
erwarten ware, oder aber deren Anteil an den insgesamt nachweisbaren Fragmenten 
mehr als doppelt so hoch ist als berechnet entsprechend Anspruch 8. 

14. Verfahren nach einem der Anspruche 1 bis 7. dadurch gekennzeichnet, daB in 
Schntt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als 
berechnet entsprechend Anspruch 8 aus ..multiple drug resistance gene" (MDR)- 
Promotoren oder kodierenden Regionen stammen. als bei einer rein zufalligen Wahl 
der Ol.gonukleotidsequenzen zu erwarten ware oder aber deren Anteil an den 
insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet 
entsprechend Anspruch 8. 

15. Verfahren nach einem der vorangehenden Anspruche, dadurch gekennzeichnet 
dafi zur Amplifkation der in Anspruch 1 beschriebenen Fragmente zwei 
Ol.gonukleotide oder zwei Klassen von Oligonukleotiden verwendet werden von 
denen e.nes oder eine Klasse aulier im Kontext CpG oder CpNpG zwar die Base C 
enthalten kann, nicht aber die Base G und von denen das andere oder die andere 
Klasse auRer im Kontext CpG oder CpNpG zwar die Base G, nicht aber die Base C 
enthalten kann. 

IS.Verfahren nach einem der Anspruche 1 bis 4, dadurch gekennzeichnet, da* die in 
Anspruch 1 beschriebene Amplifikation mittels zweier Oligonukleotide durchgefuhrt 
w.rd, von denen eines eine vier bis sechzehn Basen lange Sequenz enthalt welche 
zu einer solchen DNA komplementar ist oder dieser entspricht. wie sie entstehen 
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wOrde, wenn ein ebenso langes DNA Fragment, an welches einer der 
Transkriptionsfaktoren 



AhR/Arnt 

Arnt 
AML-1a 

AP-1 

C/EBP 

C/EBPalpha 

C/EBPbeta 

CDP 

CDP 

CDP CR1 
CDP CR3 

CHOP-C/EBPalpha 
c-Myc/Max 

CREB 
CRE-BP1 



CRE-BP1/c-Jun 

CREB 

E2F 



E47 

E47 

Egr-1 
Egr-2 
ELK-1 

Freac-2 

Freac-3 

Freac-4 

Freac-7 



aryl hydrocarbon receptor/aryl hydrocarbon receptor nuclear 
translocator 

aryl hydrocarbon receptor nuclear translocator 
CBFA2; core-binding factor, runt domain, alpha subunit 2 
(acute myeloid leukemia 1; amh oncogene) 
activator protein-1 (AP-1); Synonyme: c-Jun 
CCAAT/enhancer binding protein 
CCAAT/enhancer binding protein (C/EBP), alpha 
CCAAT/enhancer binding protein (C/EBP), beta 
CUTL1 ; cut (Drosophila)-like 1 (CCAAT displacement 
protein) 

CUTL1; cut (Drosophila)-like 1 (CCAAT displacement 
protein) 

complement component (3b/4b) receptor 1 

complement component (3b/4b) receptor 3 

DDIT; DNA-damage-inducible transcript 3/CCAAT/enhancer 

binding protein (C/EBP), alpha 

avian myelocytomatosis viral oncogene/MYC-ASSOCIATED 
FACTOR X 

cAMP responsive element binding protein 
CYCLIC AMP RESPONSE ELEMENT-BINDING PROTEIN 
2, CREB2, CREBP1; now ATF2; activating transcription 
factor 2 

activator protein-1 (AP-1); Synonyme: c-Jun 

MP responsive element binding protein 

E2F transcription factor (originally identified as a DNA- 

binding protein essential E1A-dependent activation of the 

adenovirus E2 promoter) 

transcription factor 3 (E2A immunoglobulin enhancer binding 
factors E12/E47) 

transcription factor 3 (E2A immunoglobulin enhancer binding 
factors E12/E47) 
early growth response 1 

early growth response 2 (Krox-20 (Drosophila) homolog) 
ELK1, member of ETS (environmental tobacco smoke) 
oncogene family 

FKHL6; forkhead (Drosophila)-like 6; FORKHEAD-RELATED 
ACTIVATOR 2; FREAC2 

FKHL7; forkhead (Drosophila)-like 7; FORKHEAD-RELATED 
ACTIVATOR 3; FREAC3 

FKHL8; forkhead (Drosophila)-like 8; FORKHEAD-RELATED 
ACTIVATOR 4; FREAC4 

FKHL11; forkhead (Drosophila)-like 9; FORKHEAD- 
RELATED ACTIVATOR 7; FREAC7 
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GATA-1 

GATA-1 

GATA-1 
. GATA-2 
• GATA-3 
. GATA-X 
- HFH-3 

HNF-1 

*' HNF-4 
IRF-1 
ISRE 

Lmo2 complex 
: - MEF-2 

. MEF-2 

".myogenin/NF-1 
MZF1 
MZF1 
NF-E2 

NF-kappaB (p50) 

NF-kappaB (p65) 

NF-kappaB 

NF-kappaB 

NRSF 

Oct-1 

Oct-1 

Oct-1 

Oct-1 

■ 

■ 

Oct-1 
P300 
P53 



GATA 
GATA- 
GATA- 
GATA- 
GATA- 



binding 
binding 
binding 
binding 
binding 



protein 
protein 
protein 
protein 
protein 



1/Enhancer- 
1/Enhancer- 
1/Enhancer- 
2/Enhancer- 
3/Enhancer- 



Binding Prote 
Binding Prote 
Binding Prote 
Binding Prote 
Binding Prote 



n GATA1 
n GATA1 
n GATA1 
n GATA2 
n GATA3 



FKHL'10; forkhead (Drosophila)-like 10; FORKHEAD- 
RELATED ACTIVATOR 6; FREAC6 

^ Vu a Mc, C [ ipt !? n f3Ct0r 1l hepatic: LF - B1 ' he P atic ^clear 
factor-.(HNF1), albumin proximal factor 

hepatocyte nuclear factor 4 

interferon regulatory factor 1 

interferon-stimulated response element 

LIM domain only 2 (rhombotin-like 1) 

MADS- box transcription enhancer factor 2, polypeptide A 

(myocyte enhancer factor 2A) 

MADS box transcription enhancer factor 2, polypeptide A 
(myocyte enhancer factor 2A) 
Myogenin (myogenic factor 4)/Neurofibromin 1 ■ 
NEUROFIBROMATOSIS, TYPE I 

ZNF42; zinc finger protein 42 (myeloid-specific retinoic acid- 
responsive) 

ZNF42; zinc finger protein 42 (myeloid-specific retinoic acid- 
responsive) 

NFE2; nuclear factor (erythroid-derived 2) 45kD 

nuclear factor of kappa light polypeptide gene enhancer in B- 

cells p50 subunit 

nuclear factor of kappa light polypeptide gene enhancer in B- 
cells poo subunit 

cells ear faCt ° r ° f kaPPa ' i9ht polypeptide 9 ene enhancer in B- 
nuclear factor of kappa light polypeptide gene enhancer in B- 

NEURON RESTRICTIVE SILENCER FACTOR- REST RE1 
silencing transcription factor 
OCTAMER-BINDING TRANSCRIPTION FACTOR 1 
POU2F1; POU domain, class 2, transcription factor i 
OCTAMER-BINDING TRANSCRIPTION FACTOR 1- 
POU2F1; POU domain, class 2, transcription factor 1 

OCTAMER-BINDING TRANSCRIPTION FACTOR T 
POU2F1; POU domain, dass 2, transcription factor 1 
OCTAMER-BINDING TRANSCRIPTION FACTOR 1 
POU2F1; POU domain, class 2, transcription factor 1 
OCTAMER-BINDING TRANSCRIPTION FACTOR 1- 
POU2F1; POU domain, class 2, transcription factor 1 

E1A (adenovirus E1A oncoprotein)-BINDING PROTEIN 
300-KD ^icmn, 

tumor protein p53 (Li-Fraumeni syndrome); TP53 
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Pax-1 


paired box gene 1 


Pax-3 


paired box gene 3 (Waardenburg syndrome 1) 


Pax-6 


paired box gene 6 (aniridia, keratitis) 


Pbx 1b 


pre-B-cell leukemia transcription factor 


Pbx-1 


pre-B-cell leukemia transcription factor 1 


RORalpha2 


RAR-RELATED ORPHAN RECEPTOR ALPHA; RETINOIC 




ACID-BINDING RECEPTOR ALPHA 


RREB-1 


ras responsive element binding protein 1 


SP1 


simian-virus-40-protein-1 


SP1 


simian-virus-40-protein-1 


SREBP-1 


sterol regulatory element binding transcription factor 1 


SRF 


serum response factor (c-fos serum response element- 




binding transcription factor) 


SRY 


sex determining region Y 


STAT3 


signal transducer and activator of transcription 1, 91 kD 


Tal-1alpha/E47 


T-cell acute lymphocytic leukemia 1 /transcription factor 3 




(E2A immunoglobulin enhancer binding factors E12/E47) 


TATA 


cellular and viral TATA box elements 


Tax/CREB 


Transiently-expressed axonal glycoprotein/cAMP responsive 




element binding protein 


Tax/CREB 


Transiently-expressed axonal glycoprotein/cAMP responsive 




element binding protein 


TCF1 1/MafG 


v-maf musculoaponeurotic fibrosarcoma (avian) oncogene 




family, protein G 


TCF11 


Transcription Factor 11; TCF11; NFE2L1; nuclear factor 




(erythroid-derived 2)-like 1 


USF 


upstream stimulating factor 


Whn 


winged-helix nude 


X-BP-1 


X-box binding protein 1 oder 


YY1 


ubiquitously distributed transcription factor belonging to 




theGLI-Kruppel class of zinc finger proteins 



bindet, einer chemischen Behandlung gemaB Anspruch 1 unterzogen wurde. 



17.Verfahren nach einem der Anspruche 1 bis 4, dadurch gekennzeichnet, daft man 
die in Anspruch 1 beschriebene Amplifikation mittels zweier Oligonukleotide 
durchfuhrt, von denen eines die eine vier bis sechzehn Basen lange Sequenz 
enthalt, welche zu einer solchen DNA komplementar ist oder dieser entspricht, wie 
sie entstehen wurde, wenn ein ebenso langes DNA Fragment, welches uber seine 
Sequenz oder Sekundarstruktur die spezifische Lokalisierung von 
Genom/Chromatinabschnitten innerhalb des Zellkerns herbeifuhren kann, einer 
chemischen Behandlung gemaG Anspruch 1 unterzogen wurde. 
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mverfahren nach einem der AnsprOche 1 bis 4, dadurch gekennzeichnet, daft die in 
Anspruch 1 beschriebene Ampliation mittels zweier Oligonukleotide durchgefuhrt 
wird, von denen mindestens eine der Sequenzen (von 5'nach 3') 

^GTGTA, TACACGCGA. TGTACGCGA, TCGCGTACA, 
^^GTT, AACACGCAA, GGTACGTAA, TTACGTACC, 
TCGCGTGTT, AACACGCGA, GGTACGCGA, TCGCGTACC 
TTGCGTGTA, TACACGCAA, TGTACGTAA, TTACGTACA 
TACGTG, CACGTA, TACGTG, CACGTA ,AUU,ACA -. 

ATTGCGTGT, ACACGCAAT, GTACGTAAT ATTACGTAC 
ATTGCGTGA, TCACGCAAT, TTACGTAAT ATTACGTAA 
ATCGCGTGA, TCACGCGAT, TTACGCGAT ATCGCGTAA 
. ATCGCGTGT, ACACGCGAT, GTACGCGAT ATCGCGTAC 
TGTGGT, ACCACA, ATTATA, TATAAT, ^uOGTAC, 

TGAGTTAG, CTAACTCA, TTGATTTA, TAAATCAA 
TGATTTAG, CTAAATCA, TTGAGTTA, TAACTCAA, 

TTTGGT, ACCAAA, ATT AAA, TTTAAT 
TGTGGA, TCCACA, TTTATA, TATAAA 
TTTGGA, TCCAAA, TTTAAA, TTTAAA ' 
TGTGGT, ACCACA, ATTATA, TATAAT, 

ATTAT, ATAAT, GTAAT, ATTAC 
ATTGT, ACAAT, GTAAT, ATTAC, 

GAAAG, CTTTC, TTTTT, AAAAA 
GTAAT, ATTAC, ATTGT, ACAAT 
GAAAT, ATTTC, ATTTT, AAAAT ' 
GTAAG, CTTAC, TTTGT, ACAAA, 

TTAATAATCGAT, ATCGATTATTAA, ATCGATTATTGG CCAATAATrr at 
ATCGATTA. TAATCGAT, TAATCGAT, ATCGATTA C AATAATC GAT, 

a JS2 A J£ GGl ccgat cgat, TCGATCGAT, ATCGATCGA 
ATCGATCGT, ACGATCGAT, GCGATCGAT, ATCGATCGC, 

TATCGATA, TATCGATA, TATCGGTG, CACCGATA 
TATTAATA, TATTAATA, TATTGGTG, CACCAATA, ' 

eSIJJIflJJ' ^1^™^°' GGGTA TTGTAT, ATACAATACCC, 
G I G ™IIHT. *^™ AC > OGGGATTGTAT, ATACAATCCCC 
ATGTAAi i i i i, AAAAATTACAT, GGGGATTGTAT ATACAATrrrr 
ATGTAATATTT, AAATATTACAT GGGTATTGTAT ATACAATACCC^' 
ATTAC GTGGT, ACCACGTAAT, ATTACGTGGT AcScGTAAT 9 
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TGACGTAA, TTACGTCA, TTACGTTA, TAACGTAA 
TGACGTTA, TAACGTCA, TGACGTTA, TAACGTCA, 
TTACGTAA, TTACGTAA, TTACGTAA, TTACGTAA, 
TGACGTTA, TAACGTCA, TAACGTTA, TAACGTTA, 

TGACGT, ACGTCA, GCGTTA, TAACGC, 
TGACGT, ACGTCA, ACGTTA, TAACGT, 
TTTCGCGT, ACGCGAAA, GCGCGAAA, TTTCGCGC 
TTTGGCGT, ACGCCAAA, GCGTTAAA, TTTAACGC, 

TAGGTGTTA, TAACACCTA, TAATATTTG, CAAATATTA 
TAGGTGTTT, AAACACCTA, GAATATTTG, CAAATATTC, 

GTAGGTGG, CCACCTAC, TTATTTGT, ACAAATAA, 
GTAGGTGT, ACACCTAC, ATATTTGT, ACAAATAT, 

TGCGTGGGCGG, CCGCCCACGCA, TCGTTTACGTA, TACGTAAACGA 
TGCGTGGGCGT, ACGCCCACGCA, ACGTTTACGTA, TACGTAAACGT, 

TGCGTAGGCGT, ACGCCTACGCA, ACGTTTACGTA, TACGTAAACGT 
TGCGTAGGCGG, CCGCCTACGCA, TCGTTTACGTA, TACGTAAACGA 
ATAGGAAGT, ACTTCCTAT, ATTTTTTGT, ACAAAAAAT, 

TCGGAAGT, ACTTCCGA, ATTTTCGG, CCGAAAAT 
TCGGAAGT, ACTTCCGA, GTTTTCGG, CCGAAAAC 
TCGGAAAT, ATTTCCGA, ATTTTCGG, CCGAAAAT 
TCGGAAAT, ATTTCCGA, GTTTTCGG, CCGAAAAC 
GTAAATAA, TTATTTAC, TTGTTTAT, ATAAACAA, 
GTAAATAAATA, TATTTATTTAC, TGTTTATTTAT, ATAAATAAACA, 

AAAGTAAATA, TATTTACTTT, TGTTTATTTT, AAAATAAACA 
AATGTAAATA, TATTTACATT. TGTTTATATT. AATATAAACA* 
TAAGTAAATA, TATTTACTTA, TGTTTATTTA, TAAATAAACA 
TATGTAAATA, TATTTACATA, TGTTTATATA, TATATAAACa! 

ATAAATA, TATTTAT, TGTTTAT, ATAAACA, 
ATAAATA, TATTTAT, TATTTAT, ATAAATA, 
GATA, TATC, TATT, AATA, 

TAGATAA, TTATCTA, TTATTTG, CAAATAA, 
TTGATAA, TTATCAA, TTATTAG, CTAATAA, 
GATAA, TTATC, TTATT, AATAA, 

GATG, CATC, TATT, AATA, 

GATAG, CTATC, TTATT, AATAA, 
GATAAG, CTTATC, TTTATT. AATAAA, 
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TGTTTATTTA, TAAATAAACA, TAAATAAATA TATTTATTTA 
TGTTTGTTTA, TAAACAAACA, TAAATAAATA TATTTATTTA 
I£TTTATTTA. TAAATAAATA, TAAATAAATA, TATTTATTTA. ' 
TATTTGTTTA, TAAACAAATA, TAAATAAATA, TATTTATTTA, 

GTTAATGATT, AATCATTAAC, AATTATTAAT ATTAATAATT 
2™ JES ^AATTAAC, AATAATTAAT, ATTAATTATT ' 

ATTAATTAAC, ATTAATTAAT, ATTAATTAAt' 
GTTAATGAAT, ATTCATTAAC, ATTTATTAAT, ATTAATAAAT, 

TAAAGTTTA, TAAACTTTA, TGAATTTTG, CAAAATTCA 
TAAAGGTTA, TAACCTTTA, TGATTTTTG, CAAAAATCA, 

AAAGTGAAATT, AATTTCACTTT, GGTTTTATTTT AAAATAAAAPP 
AAAGCGAAATT, AATTTCGCTTT, C^CTO^^^fe, 

^m^rr^ gggaaagtgaaattg, 

CMTTTCACTTTTCC AAAAAAA ^ AAAA ^A, GGAAAAGTGAAATTG, 

CMTTTCTCTT^ G GAAAAG AG AAATTG , 

C^^TTTcTcTtTC GGGAAAGAGAAATTG, 
TAGGTG, CACCTA, TATTTG, CAAATA, 

cTS^T^^i^™ 1 ^^^ AGGGTTATTTTTAGAG, 
l^^T^^^ 1 ^^^' GGAGTTA TTTTTAGAG. 
^^T/ffi^ TOTT1TTAAAA " AGAG ™TTTTTAGAG. 
SSc^™' GGGGTTATTTTTAGAG, 

TGTTATTAAAAATAG AAA , TTTCTATTTTTAATAACA 
TTTTTATTTTTAGTAATA, TATTACTAAAAATAAAAA ' 
TGTTATTAAAAATAGAAT, ATTCTATTTTTAATAACA 
GTTTTATTTTTAGTAATA, TATTACTAAAAATAAAAC ' 
TTTGGTAT, ATA CCAAA , GTGTTAAA, TTTAACAC ' 
GGGGA, TCCCC, TTTTT, AAAAA, 

TAGGGG, CCCCTA, TTTTTA, TAAAAA 
GAGGGG, CCCCTC, TTTTTT, AAAAAA 

JptTp a™-?"' S^EZSZ*' atgatt tagta, tactaaatcat, 
t?™£™ S^ a ' gtgagttagta. tactaactcac 

I G II GAG ir A T- ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT 
TGTTGATTTAT, ATAAATCAACA, GTGAGTTAGTA TACTAACTCAC 
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GGGGATTTTT, AAAAATCCCC, GGGAAI I I I I, AAAAATTCCC, 
GGGGATTTTT, AAAAATCCCC, GGGGATTTTT, AAAAATCCCC, 
GGGGATTTTT, AAAAATCCCC, GGAAATTTTT, AAAAATTTCC, 
GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, 
GGGAAI I I I I, AAAAATTCCC, GGAAATTTTT. AAAAATTTCC, 
GGGATI I I I I, AAAAAATCCC, GGAAAGTTTT, AAAACTTTCC, 
GGGAAI I I I I, AAAAATTCCC, GGGAATTTTT, AAAAATTCCC, 
GGGAI I I I I I, AAAAAATCCC, GGGAAGTTTT, AAAACTTCCC, 
GGGAI I I I I IA, TAAAAAATCCC, TGG AAAGTTTT , AAAACTTTCC A , 
TTTAGTATTACGGATAGAGGT, AC CTCTATC CGTAATACTAAA, 
G I I I I I GTTCGTGGTGTTGAA, TTCAACACCACGAACAAAAAC, 
TT TAGTA TTAC GGATAG AGTT , AACTCTATC CGTAATACTAAA, 
GGTTTTGTTCGTGGTGTTGAA, TTCAACACCACG AACAAAACC , 
TTTAGTATTACGGATAGCGTT, AACGCTATCCGTAATACTAAA, 
GGCGTTGTTCGTGGTGTTGAA, TTCAACAC CACG AAC AAC GCC , 
TTTAGTATTAC GGATAG CGGT, ACCGCTATCCGTAATACTAAA, 
GTCGTTGTTC GTGGTGTTGAA, TTCAACACCACG AAC AACGAC , 

ATATGTAAAT, ATTTACATAT, ATTTGTATAT, ATATACAAAT, 
TTATGTAAAT, ATTTACATAA, ATTTGTATAA, TTATACAAAT, 

GAATATTTA, TAAATATTC, TGAATATTT, AAATATTCA, 
GAATATGTA, TACATATTC, TGTATATTT, AAATATACA, 

ATAAT, ATTAT, ATTAT, ATAAT, 
GTAAT, ATTAC, ATTAT, ATAAT, 

AATGTAAAT, ATTTACATT, ATTTGTATT, AATACAAAT, 

ATTTGTATATT, AATATACAAAT, GGTATGTAAAT, ATTTACATACC, 
ATTTGTATATT, AATATACAAAT, AATATGTAAAT, ATTTACATATT, 
ATTTGTATATT, AATATACAAAT, AGTATGTAAAT, ATTTACATACT, 
ATTTGTATATT, AATATACAAAT, G ATATGTAAAT , ATTTACATATC, 

AGGAGT, ACTCCT, ATTTTT, AAAAAT, 
GGGAGT, ACTCCC, ATTTTT, AAAAAT, 
GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, 
GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, 
GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, 
AGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCT, 
TCGTTTCGTTTTAGATAT, ATATCTAAAACGAAACGA, 
ATATTTAGAGCGGAACGG, CCGTTCCGCTCTAAATAT, 

CGTTACGGTT, AACCGTAACG, AATCGTGACG, CGTCACGATT, 
CGTTACGGTT, AACCGTAACG, GATCGTGACG, CGTCACGATC, 
CGTTACGTTT, AAACGTAACG, AAGCGTGACG, CGTCACGCTT, 
CGTTACGTTT, AAACGTAACG, GAGCGTGACG, CGTCACGCTC, 
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{™CGWGA, TCATACGTAAA, TTATGCGTGAA, TTCACGCATAA, 
S^CGT^A, TCAMCGTAAA, TTAAGCGTGAA, TTCACGCTTAA 
TTTACGTTTTA, TAAAACGTAAA, TGAAGCGTGAA TTC ACGPTTPA 
TTTAC GTATTA, TAATACGTAAA, TGATGCGTGAA, tIcAcIcaTca; 

™™™ ' ZJAATTAATT. TTGATTGATT, AATCAATCAA 
TATTAATTAA, TTAATTAATA, TTGATTGATG, CATCAATCAA, 

TAATTAT, ATAATTA, ATGATTG, CAATCAT, 
TAGGTTA, TAACCTA, TGATTTA, TAAATCA, 

^^cJ^ct^ TATTTAAAA ' GGGGG TGTTTGGGG, 
^^^cJ^cl^^^' GGGGTGG TTTGGGG, 
C^^^c^^ 771 ^ GGGGGGGTTTGGGG, 
^5S^c^™ mAAAA ' GGGGTTG TTTGGGG, 

GAGGCGGGG, CCCCGCCTC, TTTCGTTTT AAAACGAAA 
GAGGTAGGG, CCCTACCTC, TTTTGTTTT /^AACAAAA 
AAGGCGGGG, CCCCGCCTT TTTCGTTTT ^A^CGAAA 
AAGGTAGGG, CCCTACCTT. TTTTGTTTT, AAAACAAAA^' 

GGGGGCGGGGT, ACCCCGCCCCC, ATTTCGTTTTT AAAAACGAAAT 

GGGGGCGGGGT - ACCCCGCCCCC gtttcgttttt' aaaaacga^c 

gItTa^t' A a ^ taata - g tggggtgat^tS^c?aT ' 
gattattttat, ataaaataatc, gtggggtgatt, mtcaccccac, 

attacgtgat, atcacgtaat, attacgtgat atcacgtaat 
attacgtgat, atcacgtaat, gttacgtgat. atcacgtmc, 

ttttatatgg, ccatataaaa, TTATATAAGG CCTTATATAA 

Hatatatgg, ccatatataa, ttatatatgg,' ccatatatm 

AAATAAT, ATTATTT, GTTGTTT, AAACAAC ' 
AAATTAA, TTAATTT, TTAGTTT, AAACTAA ' 
AAATTAT, ATAATTT, GTAGTTT, AAACTAC 
AAATAAA, TTTATTT, TTTGTTT, AAACAAA, 

atttScI^a catttccgaaaaat . tattttcgggaaat, 

ATTTCCCIS 1 CATTTCCGAAAAA ^ TATTTTCGGGAAAT, 

attt^cga^ta 3, catttcccgaaaat ' tatttttcggaaat, 
attttcgggaagtg, cacttcccgaaaat, tatttttcggaaat, 



WO 01/42493 



45 



PCT/DE00/04381 



ATTTCCGAAAAATA, 

AATAGATGTT, AACATCTATT, AATATTTGTT, AACAAATATT, 
AATAGATGGT, ACCATCTATT, ATTATTTGTT, AACAAATAAT, 

GTATAAATA, TATTTATAC, TATTTATAT, ATATAAATA, 
GTATAAATG, CATTT ATAC, TATTTATAT, ATATAAATA, 
GTATAAAAA, I I I I IATAC, I 1 1 I IATAT, ATATAAAAA, 
GTATAAAAG, CTTTTATAC, I I I I I ATAT, ATATAAAAA, 
TTATAAATA, TATTTATAA, TATTTATAG, CTATAAATA, 
TTATAAATG, CATTT ATAA, TATTTATAG, CTATAAATA, 
TTATAAAAA, I I I I IATAA, TTTTTATAG, CTATAAAAA, 
TTATAAAAG, CTTTTATAA, TTTTTATAG, CTATAAAAA, 
GGGGGTTGACGTA, TACGTCAACCCCC, TGCGTTAA I I I I I, 
AAAAATTAACGCA, 

GGGGGTTGACGTA, TACGTCAACCCCC, TACGTTAA I I I I I , 
AAAAATTAACGTA, 

TGACGTATA Mill, AAAAATATACGTCA, GGGGATATGCGTTA 
TAACGCATA TCCC C, 

TGACGTATA Mill, AAAAATATACGTCA, GGGGGTATGCGTTA, 
TAACGCATACCCCC, 

ATGATTTAGTA, TACTAAATCAT, TGTTGAGTTAT, ATAACTCAACA, 
GTTAT, ATAAC, ATGAT, ATCAT, 

TTACGTGA, TCACGTAA, TTACGTGG, CCACGTAA, 
TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA, 
TTACGTGG, CCACGTAA, TTACGTGA, TCACGTAA, 
TTACGTGA, TCACGTAA, TTACGTGA, TCACGTAA, 
GACGTT, AACGTC, AGCGTT, AACGCT, 

TGACGTGT, ACACGTCA, ATACGTTA, TAACGTAT, 
TGACGT GG, C CACGTCA, TTACGTTA, TAACGTAA, 
CGGTTATTTTG, CAAAATAACCG, TAAGATGGTCG oder CGACCATCTTA 



enthalt, welche zu einer solchen DNA komplementar ist oder dieser entspricht, wie 
sie entstehen wQrde, wenn ein ebenso langes DNA Fragment, welches uber seine 
Sequenz oder Sekundarstruktur die spezifische Lokalisierung von 
Genom/Chromatinabschnitten innerhalb des Zellkerns herbeifiihren kann, einer 
chemischen Behandlung gemad Anspruch 1 unterzogen wurde. 



19.Verfahren nach einem der Anspruche 16 bis 18, dadurch gekennzeichnet, daB die 

t 

zur Amplifikation verwendeten Oligonukleotide aufter den in den Ansprtichen 16 bis 
18 definierten Konsensussequenzen mehrere Positionen enthalten, an denen 
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entweder irgendeine der drei Basen G, A und T Oder irgendeine der Basen C, A und 
T vorhanden sein kann. 

20. Verfahren nach Anspruch 19, dadurch gekennzeichnet, da* die zur Amplifikation 
verwendeten Oligonukleot.de au&er einer der in den Anspruch 18 beschriebenen 
Konsensussequenzen nur maximal zusatzlich so viele weitere Basen enthalten wie 
es zur gleichzeitigen Amplifikation von mehr als einhundert verschiedenen 
Fragmenten pro Reaktion aus der chemisch behandelten DNA. berechnet 
entsprechend Anspruch 8, erforderlich ist. 

21. Verfahren nach einem der vorangehenden AnsprUche dadurch gekennzeichnet daR 
d.e Untersuchung des Sequenzkontextes aller Oder eines Teils der in den 
amplifizierten Fragmenten enthaltenen CpG Dinukleotide Oder CpNpG Trinukleotide 
gemalJ Anspruch 1 c) durch Hybridisierung der bereits in der Amplifikation mit einem 
Fluoreszenzmarker versehenen Fragmente an einen Oligonukleotid- Array (DNA 
Chip) erfolgt. 

22. Verfahren nach einem der AnsprUche 1 bis 20 dadurch gekennzeichnet daS diev 
amphfizierten Fragmente auf einer Oberflache immobilisiert und anschlieftend eine 
Hybnd.sierung mit einer kombinatorischen Bibiliothek von unterscheidbaren 
Oligonukleotid- Oder PNA-Oligomer-Sonden durchgefuhrt wird. 

23. Verfahren nach Anspruch 22 dadurch gekennzeichnet, daS die Sonden mlttels 
Matnx-assistierter Laser-Desorptions/lonisations Massenspektrometrie (MALDI-MS) 
anhand ihrer eindeutigen Masse nachgewiesen werden und damit der 
Sequenzkontext alter oder eines Teils der in den amphfizierten Fragmenten 
enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide entschlusselt wird. 

24. Verfahren nach einem der vorangehenden Anspruche, dadurch gekennzeichnet 
daft die Amplifikation wie beschrieben in Schritt b) des Anspruchs 1 durch eine 
Polymerase Kettenreaktion ausgefUhrt wird, in der die Grofte der amplifizierten 
Fragmente mitteis auf weniger als 30 s verkurzter Kettenverlangerungsschritte 
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begrenzt wird. 

25. Verfahren nach einem der vorangehenden Anspruche, dadurch gekennzeichnet, 
daR nach der Amplifikation gemaft Schritt b) des Anspruchs 1 die Produkte durch 
Gelelektrophorese aufgetrennt werden und die Fragmente, die kleiner als 2000 
Basenpaare Oder kleiner als ein beliebiger Grenzwert unterhalb von 2000 
Basenpaaren sind, durch Ausschneiden von den anderen Produkten der 
Amplifikation vor der Auswertung gemaii Schritt c) des Anspruchs 1 abgetrennt 
werden. 

26. Verfahren nach Anspruch 25 dadurch gekennzeichnet daft nach der Abtrennung 
von Amplifikaten bestimmter Grofte diese vor der Durchfuhrung des Schrittes c) des 

■4 

Anspruchs 1 nochmals amplifiziert werden. 

27. Kit, enthaltend mindestens zwei Primerpaare, Reagenzien und Hilfsstoffe fur die 
Amplifikation und/oder Reagenzien und Hilfsmittel fur die chemische Behandlung 
gemaft Anspruch 1 a) und/oder eine kombinatorische Sondenbibliothek und/oder 
einen Oligonukleotid-Array (DNA-Chip), soweit sie fur die Durchfuhrung des 
erfindungsgemaden Verfahrens erforderlich Oder dienlich sind. 
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SEQUENZPROTOKOLL 

ALLGEMEINE ANGABEN: 
ANMELDER: 

NAME: Epigenomics AG 
STRASSE: Kastanienallee 24 
LAND: Berlin 
POSTLEITZAHL: 10435 
TELEFON: 030-243450 
TELEFAX: 030-2 4 34 5555 

BEZEICHNUNG DER ERFINDUNG: Verfahren zur parallelen Detektion 

des Methylierungszustandes von 
genomischer DNA 1 

ANZAHL DER SEQUENZEN: 31 

COM PUTERLES BARE FAS SUNG : 

DATENTRAGER: Diskette 
COMPUTER: IBM PC-komtatibel 
BETRIEBS SYSTEM : PC-DOS /MS-DOS 

DAT EN DER JETZIGEN ANMELDUNG: 

ANMELDENUMMER: nicht bekannt 
ANMELDETAG: 6. 12.2000 

ANGABEN ZU SEQ ID-NO: 1: 

S EQUEN ZCHARAKTERI S TIKA : 
LANGE: 12 Basen 
ART: Nukleinsaure 
STRANG FORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG : SEQ ID-NO: 1 : 
AGTAGTAGTA GT 

12 

ANGABEN ZU SEQ ID-NO: 2: 

SEQUENZCHARAKTERISTIKA : 
LANGE: 12 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKOLS: chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 2: 
AAAACAAAAA CC 

12 

ANGABEN ZU SEQ ID-NO: 3: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 973 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 
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ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 3: 

AGTAGTAGTA GTAGCGTTTT TGAAGTTTTT TGTGGAAGGT GAGAAATTTA TCGATAAGTT -60 

TTTTAGTAGG AGTGTTTTTG GGGAGGGAGT GAGTGGGAGA TTAGAAATGG GGTCGGTGGA 120 

ATATTTTTGT AAAATTTTAG GAATTATTAG TATTTTATTT TTTTTTATAA AGATTGTTTT 180 

TATGTTTGAG TTGTTTTATA TAGTGTAGAA ATTGAGAATG TAAACGTGTA AACGATCGGT 2 40 

GTGATTTATT GAAAGGCGAT GCGCGTTTTT TTTTTGTAGG TAGAATTGTT TTAGGAAGTA 300 

TGAAAGTGGA CGTAGTTCGG TGTTAGGTGT TAGCGATTTG AGTTCGTTTT CGGGTTTTAT 3 60 

TTATTTTTAG TTCGGTTTTT AGATATTTTT CGAGGCGTTT TTTTTTGTTC GTTCGATTTT 4 20 

TGAGCGGAGC GTTTCGGGGT GTGAGGAGAA TCGGTAAATT TTCGCGGGCG TTGGGCGTCG 4 80 

TAGAGTCGTC GCGCGTTTAG TTTCGTTACG TTGGTTGTCG AGCGTATTTC GGTTGCGTTC 5 40 

GGCGGGGAGG CGTCGAGGGT AGTTAAGGGG AGTAGGTTAC GTGAGAGGAG GAGTTTGATT 600 

TATTTTTTAG GCGGTAGGCG TATGCGTATT TTTTATTTGC GTTTCGGTCG GGAGGTTTAC 660 

GTGGAATCGT ACGTGTTTGG TTTTGTAGTT AGGGGTTTTT GGTTCGGGGC GCGTAGGGGC 7 20 

GGGTTCGTAG TGGGATTCGC GGAGAGGGGC GCGGCGGGGC GGAGCGTTTG GAGATTTAGT 780 

TTGCGGGTTT CGTAATTATT ATTCGTGATA ATTATAGTTT TTGGAGAGTT GTTTAGGTTT 84 0 

TTTGCGGGGT TTTTTACGAA TTTATTATAT TTAATATTCG TGAATTTAGA AATTAAGATA 900 

AAGATTGTAT TTTTGTTTTG TAAATTATTA GTTTCGTAAT TTAGAATTTA TTTTGTAAAT 960 

GGGTTTTTGT TTT 973 

ANGABEN ZU SEQ ID-NO: 4: 

SEQUENZCHARAKTERISTIKA : 
LANGE: 1890 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS : chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG : SEQ ID-NO: 4: 

AGTAGTAGTA GTTAAGTTTA AGAGTGATAT TTTTTTAGAT ATAGTATAAT ATTGTTTTTG 60 

TAAAAGGTTA TTTATATGAA TATAATGTTT TTTGGGTTAA TTAATTCGTT TTGAGAATAG 120 

TTAGGTTAAA ATTTTTAGGT TTTTTATTTT GGGTTATTTA AGTTAGGATC GCGACGTGAG 180 

TTCGGGGTGA GTCGAGGGGT ATTTCGGGTC GAGGTTATTC GAATCGAAGT TATGAGGCGC 240 

GGGTCGGTAA TCGGAAGTGG TTTAGGGAGA GTTGTACGAG ATTCGGGGGT TGTGATTTGG 300 

AAATAAAATA AAATAAAATA AAATTTTAAT TGTTTTGGGA TTGATTTTTA AAAGAGCGTT 360 

TTTTTGGTTT AAGAGGTCGG CGTTCGCGGA GATGTCGTTT TAAAGGGTTG TTTTTTAAGC 4 20 

GTGTAGGTCG CGTACGGGTT TTTTTAGCGG GCGGGTAAAA TGGGCGTCGG TATTCGGGAG 4 80 

GCGTTTGTTT AGGCGTTCGG GCGTCGTTTA TAGAGTACGT TCGTTTGCGG TTTTAGAGCG 54 0 

TCGTTTTTTT GTCGTTTTCG TCGTTCGGTT TGACGTTCGG ATCGCGGTCG GTTATCGTTT 600 

TTCGTTTCGA CGGTTACGTT TGTTTTAAAT CGCGCGGGCG TTTTTTAGGT GTTGTTGGGC 660 

GGGTTTCGTT TTCGTGTTTT AAGGTTCGTT TTCGCGCGTT AGTCGCGCGT TCGTTGTTTT 720 

TTTTTCGTTT TTATAGTTTC GTTTTTATAG TTTCGTTCGT TTTTTAAGTT TCGTTTTTTA 7 80 

GGAATTCGCG CGTCGAAGGT TAGGTTTGGG CGGAGCGTAT AGCGTTGGGC GTTGGGGAGG 84 0 

TTGCGTCGTA GTATTCGGTT GGTTAGGATT AAGTGGGTTC GAGGCGGACG TGAGAAGGGT 900 

CGGGTTAAGA TGGCGGTGTA GGTGGTGTAG GCGGTGTAGG CGGTTTATTT CGAGTTTGAC 960 

GTTTTTTTCG TTTGTTTTAA TTACGTTTTG AG TAT AG AG A AGGAGGAAGT AATGGGGTTG 1020 

TGTATAGGGG AGGTGAGTAG GTTTGTTAGT TTGGATGGAA TTTTGTTGAG TAGTTTTAGT 1080 

GTGTTTTCGG GGTGGGTGTC GGTAGTTTTT AGGGTTGCGG AGGTTATAGG TATTTTCGAT 1140 

TTAGGTTTTT GGATATTTTT TATATAGTTT TGTCGCGGGG AGTTTCGTTT TTTTTGGTCG 1200 

TTTGATATTT GTTTAGTTTT TTGCGAGTTT TCGGCGGTTT GTATAGGTTT CGGGAGTTTT 12 60 

GTTTTTTTTT TTGTAGTTTG GGGTTTTTTT TTAGATTTGC GTTTTTCGTT CGGTTGATTA 1320 

AAATTGTAAG GTAGGTTAGA AAGATATTGG AGTATAATGA GGATGTTCGG GTATTACGAC 1380 

GTAGTAGTTG ATTATAGTTA GAGTTTTTTG TTTCGTTTCG AGTTTTTTGT TTAGGGAGTA 14 4 0 

GAGATATTAA TTAAAGTATT TGAAGGGTAT CGAAGAGTTT AATAGAAGGT GCGGGGTTTG 1500 

AAGGAAGTAA AAGTTTTCGT TGTATTGTGT TGAGGAGGGG TCGAAGAGGA TGAGGAAATA 1560 

TAGTTTAGTT GTTTATAGTT TAAAGTAATT TTTTAGTTTT TTATATTATG TGCGTGAATA 1620 

TATGATTTAA TTGTTATATA ATTTGTATTT ATATATGTTA AATAAACGTA ATGTGATTAA 1680 
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TAATGTTTTT TGTTTTTTTT TATTTTAGTT GAACGATGAT ATAAGGTAAG ATTGTATTTG 174f1 
TTTATTTATA TTTTATAATT TTTAAGTTAT TGTTAATTTA AAATTATGGC GATTTOGCTA lloo 
GTATTGTGTT CGGATCGTGT TTTAAATTAA TTATTATTAT TATTTCGGGG TTTTTTTAAT 18 60 
GATATAATTT TGAATTTTGG TTTTTGTTTT umilAAl 10 6C 

18 90 

ANGABEN ZU SEQ ID-NO: 5: 

SEQUENZCHARAKTERISTIKA: 
LANGE : 2222 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEK0LS: chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG : SEQ ID-NO: 5: 



TT 

ANGABEN ZU SEQ ID-NO: 6: 

SEQUENZCHARAKTERISTIKA : 
LANGE: 307 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 



TTATATATTG 


60 


GTGGAGGGGA 


120 


GATGGTTAGC 


180 


GACGGCGGGG 


240 


GGTTTCGCGT 


300 


CGCGGGATTC 


360 


TCGGGGTTCG 


420 


AGGAAGTTAA 


480 


GGAGAAGTGT 


540 


r I T I'll 1l "11 Y V « V * mm # _ m± mmm* 

TTNNNNTTNT 


600 


GCGTCGGTCG 


660 


GTCGAGATTT 


720 


AAGAAGAAAG 


780 


CGTCGCGTCG 


840 


TACGAAAAAA 


900 


GGGCGGGTTT 


960 


CGCGTGTTTT 


1020 


AGTCGGTCGT 


1080 


TGACGTCGCG 


1140 


AGGTTGGGAG 


1200 


CGCGAGTGTT 


1260 


AGTAGAGGAG 


1320 


AATTTAAGTT 


1380 


TATTATAGAA 


1440 


TATTTGTAAT 


1500 


AAGTTGGTCG 


1560 


TTATTCGTAG 


1620 


TTGGCGGAGT 


1680 


TTTATTTTTT 


1740 


ATTATAATAG 


1800 


AATAAAGTTG 


1860 


AATTAGTTAT 


1920 


GTGTGTGTGT 


1980 


TTTTTTATTG 


2040 


AAAAAGTTTT 


2100 


TATATGATGA 


2160 


GGTTTTTGTT 


2220 




2222 
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TOPOLOGIE: linear 



ART DES MOLEKULS : chemisch vorbehandelte Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 6: 



AGTAGTAGTA GTTTCGTTAC GAATACGATT AGTTTATATT GGTTGTTTAG TATTTCGGTT 60 

AGTTTTTGTG GGACGTTGGC GCGTATATCG TTTCGTCGGG GGGTCGGGGA TTTCGGGGAT 120 

TTCGGGGTCG AGGACGAGGG AGGCGAGTAG GTCGTTGGTT TCGACGATTT TGCGATCGAG 180 

GCGTTTGTAG TTGTTCGGGG CGAGGCGGGC GATTTTAGGT TTTCGAGTAT TTTCGAGATA 24 0 

TTCGCGTTAA GTTTGGTTTC GGGGGTGGTT GTCGTCGGGT TTCGTTTGCG TTTTTGGTTT 300 

TTGTTTT 307 



ANGABEN ZU SEQ ID-NO: 7: 



SEQUENZCHARAKTERISTIKA: 
LANGE: 523 Basen 
ART: Nukleinsaure 
STRANG FORM : Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 7: 

AGTAGTAGTA GTTGTTGTTG TTCGAGGTTT CGGTGTAGTT GGAAGTTTTG GAGGTGGGGA 60 

GAGGGATGTT AGGTAAGTGG TACGGCGAGC GTAAGGGAAG GGGTTAGTTA TTGATTAGCG 120 

GTAGTAATTG TAGGAATCGT CGTCGTAGTT GTAGTCGTTT TTTCGTTCGT TTTTTCGGGT 180 

TTTCGGGAAA ATGGTTGTGG GGTTGGTCGC GTCGTTAAGT TTGTTTTCGC GCGGTGAAGA 24 0 

GCGGGTTGTT TGGGGGAGTC GTTTTTTAAT TTCGCGGCGC GTTTATTTTT GCGGAGTTCG 300 

TGGTAGGATT CGAGGGGTTA CGAGTTGATA TTTTTTTGGG TTGTATAAAA AGTTGAGGCG 360 

GGCGTTGGGA GGAGGTAGCG GTTGTTGCGG TGCGGTTTTT TTTTTTTTTT ATATTTTGTT 4 20 

CGGGTTATTT TTTTTTTTTT TTTTTTTCGT TTTTCGTTTT TTTTTTTACG CGGGTTTTTC 4 80 

GGGGTTTTGG CGGTTTTCGG TTGAAGGTCG CGGTTTTTGT TTT 523 



ANGABEN ZU SEQ ID-NO: 8: 



SEQUENZCHARAKTERISTIKA : 
LANGE: 653 Basen 
ART: Nukleinsaure 
ST RANG FORM: Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 8: 



AGTAGTAGTA GTAGCGTCGG GAGTTCGCGT AGAAACGATT TGATTTTTCG CGGCGTTATT 60 

TTTTTTTGCG ATTGGCGTTG CGCGGAGAAA ATTTAGTTTG TCGATGTTTC GTTTATTATT 120 

TCGTTTTTAT TTATCGCGCG GTTTTTTGGG AATTGTAGTT TTTTCGTGAG CGGTCGGTAG 180 

CGGCGAGGTC GTCGGCGGAT TTTAGCGTTT AGGAAGTTTT GCGTAGGCGT AAGCGTTTTT 24 0 

TAGGTAATTA CGTCGCGGTT CGAGGTTGTA GATTTTGGTA GGGGATATAA TTGGAGAATG 300 

AGGGTGGTCG GGTGGGAGTA GGGATTAGGT TTTATTTAGA GTTCGGAGTT TGGAGTTCGT 360 

ACGATTCGAG GTTTTTTTTT TTTTTTGTTT TATAGAAAGA GCGGAAAGTT TAAGAATCGG 4 20 

GTCGCGTTTG GTTGAGTTTG ATAATGTTTC GGTTTTACGC GTATTGACGT CGATTTTTGT 4 80 

ATGTTTAGTG TCGTTGCGGG GTTGGTATTG CGGTTCGGGT TTGGCGTTGA GGAGTTTGGT 54 0 

TTAGTTCGTT TTTGTTTTTC GCGGAGCGTT TGGTCGTGGG TAAGTTTAGG TTAGGTTGTT 600 

TCGGGGACGT AGGGTCGCGT AGACGTTTTT TTACGTTTCG GGGTTTTTGT TTT 653 



ANGABEN ZU SEQ ID-NO: 9: 

SEQUENZCHARAKTERISTIKA: 
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LANGE: 14 61 Basen 

ART: Nukleinsaure 

ST RANG FORM : Einzelstrang 

TOPOLOGIE: linear 



ART DES MOLEK0LS: chemisch vorbehandel te Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 9: 



AGTAGTAGTA GTAGGCGGTG GTTAGGTCGG GTCGGGCGGT TATTAGCGGT TTTCGGArrT 
ATTTAGGTTT TACGGTCGAG TTTTTGGTCG GAGATCGGTC GTTTACGGGG GGTTATAGTA 
GCGGTCGTTC GTTTAGGATG GAGAGGCGGG TTTTAGGTTC GGTTCGGAGC GAGTTTTTTA 
GGGTTTGTCG ATACGGCGGG GTTCGGTGGT CGGTATTTGG TTCGTACGTG TTCGAGGGGT 
TTTCGGGTTT TCGGTATTAT GGTTATTATC GGGGTTTCGA TTACGACGAG GTCGATGGTT 
CGGGTAGCGG GGGCGGCGAG GAGGTTATGG TCGGGGTTTA CGACGCGTTA TTTTTCCTAO 
GATACGCGTT TTCGGGCGTT ATCGGGCGTT CGTTTAGGAT TTTTCGGGTT TCGGGTTrrr 
TTTGCGTTTC GTTTTTTCGG TACGGTCGGC GATTTTTTAA CGGTTATTAT TCGGCGTACG 
GATTGGTTAG GTTTCGCGGG TCGGGTTTTA GGAAGGGTTT GTACGAATTT TATAGCGACA 
GTGACGATGA TTGGTGTTAA GTTCGGGCGA GGTGGCGTTC GTTCGGTTTT TTACGTATTT 
TACGTATATA TTTTATTCGA GGAGTCGCGT AGAGGTCGCG GGGGTTTAGT ATAGAGGGTT 
CGGGAGAGGG TTAGTCGGGA GATTTTAGAT TTTGGAGAGG TTAGGGTTGG GTTATAAGGG 
TGTTTCGTAG AGATTTTCGG TTAAAAGAGA TTTTTTTGGG TAGTTACGGC GTTTTTTAAT 
^IT TCGAT TTTTTTATTT ACGATAGGGG TTTTCGGGTG GGAGGTAGGG AGTAGATAAA 
TTATATAGTT AAGGGATTTG AATTAATTTA GTTATTTTTG GAGAATTTTG GGGAATATGA 
AAAAAAAAAA AAAAAAAAAA AAAAAAAATA TTTTTAAAAG AAAAAACGGG GAGAAAAAAA 
TAGTTTTTAT TGATGAGTTT TATTATTTTA ATTGAATTTT TTTTTTTTTT GATGAAGATA 
GTTGGTGGTC GAGTGCGGTA AAGAAGTTAG AAGGAATTAG AATTTTAGTG TTTTATATTT 
^™ GAT ATATTTATAT TTATATACGT TTTTAGATAT ATATAAGAGT GTTTGTCGGT 
TATATTAAAT TTTATTATTA TTGTTTGTAG AAATTAATTT AAAAAAATAA TAATAATAAT 
AAATAATTTT AAAAAGGATA AAAAAATTAA TGATTGAGAA AAGAGGTATT TTTTTTTGAT 
ATTTGGTTTT GTTTGAAATA ATAAAAGAAG AAGAAAAATT TATTATTATT ATCGATTTTT 
ll^lirr TTTTTTTTTT TTTTATTTTG TTTGAAAATC GTGGGTTTGG GAT?ctS5 
TATTGTATGA TATTTAAAAA GAAAAAAAAA ATAAAAAAAA GTTGAATTAA AGGGTTTTTG 14 4 0 
GATAGGAGTG GTTTTTGTTT T mum ^bbiuiib 14 4 0 

14 61 

ANGABEN ZU SEQ ID-NO: 10: 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 



SEQUENZCHARAKTERISTIKA: 
LANGE: 2536 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEKOLS : chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 10: 

AGTAGTAGTA GTAATCGGGT CGTCGTCGTC GCGGGGTTAA GAGATTACGT TTAGTAAAAA 
TTTTTTTAGG AAAGAGGTTC GAGAGTTTTT TTTTTATTTC GTTAAGGGTG TTGATTTTTT 
CGCGTTACGT TACGTATTAA AAGGTTCGCG AAGAAAAACG CGGGCGAAGT TTAGTATTTT 
CGAATAGAAA GGGAATTTAT TTTAGAAGGG GGGTTTACGG GTTTGAGGGT TTTTGGGTGP 
GGAAAGTAGT ATTGGAGGGA GAAGATAGAA GGGATGGTAA GATAGAGGAA ATTACGGGGA 
TAAAAAGGAA GGGATGAGGA GTTTTTTTAT TATAAAAGGG ATTGACGGAC GGGATGTAGA 
GTAATGGGTT TTTTTCGAAA AATGGATTGG TAGGTTTTTT CGTATTTTTA AATAATTTCf 
TATTATTTGA AAGCGGGGAG TTTGAGTTTG GGGTTGCGTA GATTAAAGTA GGGTAAGACG 
AAGGGAAAGA GGGAGGGGAG TTTGGAAGTA AAGTGAATAA AGAGGTAAAA GAGGTAAAGT 
TGGAAATGGA AACGAGAAAG GGAGTTGGAA AGGGGTCGTT TTGGAAGGGT TTTGAAAAAG 
GTTTAGAAAT GGGATGTTGG GGAGGTAAAG GGGGATAGTT TCGAGGAAGG GTATTTTAGG 
AATGTAAGGG AGCGTTTTAG GTTTTGGGAA GAGGAAGGGA TGGGAGGGCG GGGAGGTAGT 
CGAGGTTCGG GAGTTGGAAT AGAGGGGGTT TTGCGCGGGG TTTAGGAGGG GAGAGTAGGG 
TCGGAGGGAG GCGATTATCG CGGGAAGAGT TAGAGGATGG GAGGGAGGGG TGTTGCGGTT 
GAAGAGGGGA TGTGGATTTT TTTAATGTTA GGGAGAAGAG GGAGGTGAAG CGAGATAAAA 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
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GGAAAGGGGC 

GGTCGTGGGA 

ATTTTAGGTT 

TTTTCGGTTT 

ACGGTTTATA 

GGTAGCGGTA 

TCGCGGGTCG 

TGGTTTTTTG 

CGTATTTTGC 

GTTTATTTAT 

GATATAAGTT 

AGAGATATTT 

TAAATATTAC 

ATTTGAAGGG 

TAATTTCGTT 

TGTTTAGTAT 

GTATTGGAAT 

ATTTTATTGT 

TTAAAATAGG 

GTGTTAGTTT 

GGGTAGGAAT 

AGTTTTTTGG 

GATTTTTTGT 

TTGTTTTTTG 

TGGTTTTAGA 

ATGTTGTAAT 

AGAAATTAAT 

TTTTGGTTTT 



GAATAGGGAG 

AGCGGTCGGG 

GCGGATTTTT 

TTTCGTTCGT 

GCGGCGGTTT 

GCGGTAGCGG 

AGTTTTTTAG 

CGTTTGTTTT 

GTTTGCGCGC 

AATCGCGTTC 

TAGTTAAGTT 

GGACGCGTAT 

GGGTCGTAAG 

TTGATTTTGT 

ATTGATTGGA 

TAAGTGTAGG 

TGTTTATTGA 

AGTATGAAAT 

TTAATGTATG 

TT AT TAT AG A 

TGTTGTTTAG 

GTTTGGTAAG 

AATTTTTATT 

T T T T T T T T 

TGTTGAAAGG 

TATATTGGGT 

GTATTGTAAT 

TGTTTT 



AAGAGGAAGG 

GGGCGCGGGG 

TTTTTGGGGA 

TTTTTCGTTT 

TTTTGCGTCG 

TTCGGTTCGT 

TAGTCGGCGT 

TTTCGTTTTC 

GGTTTAGTTA 

GCGGAGTGTT 

TATATAGTTC 

TGTGATAGGC 

CGTTTATATT 

TTCGGTGTAT 

TTAGATTGTA 

TATTTAAATT 

GTATTTGTAA 

TAAATGGTGT 

T T T T T T T T T T 

ATGCGTAATT 

AATATATAGT 

ATTTTTTATT 

TTTATTTTTT 

CGTTAGTTTT 

GTTAGTGTAT 

TATGTTGAAA 

TTCGATGTTT 



AGTTTGCGAC 

ATGGGAAGGG 

GCGGCGTTGT 

TTTTCGGGCG 

AGTTTCGGAT 

ACGGTTATTA 

CGGCGTCGGC 

GGCGTTTTGC 

GCGCGGCGCG 

TTTCGTATCG 

GGTTCGGGTG 

GTTATTTTGA 

TATATTTATT 

TCGTAGTAGT 

AATTTTTTGG 

TTTGTGGAGT 

TAATTTTGAT 

TTGTGTGTTT 

TTTAACGTAG 

TTATTTTAAT 

TTGAAGTATA 

TTTTATTTGT 

TTGTTTTTTA 

TGGGGAGTTA 

ATAGAAGATA 

TTGTGAAGTT 

GTGTTGAGGA 



GCGATGGGGG 

GTCGGGCGGG 

CGGCGGGCGG 

GCGGCGGGGG 

GTTGTTTTTG 

TCGTTCGCGG 

GGCGGCGGCG 

GGCGGTCGCG 

TTTTTTTCGC 

TTTTCGGTGC 

GTTATGGAGA 

TATACGTGTT 

TGTAGGGATT 

AATGATGCGA 

CGTTTGGGAT 

AAGTGATTGG 

TTTATGGTTT 

GTTTTGTTTT 

AGGAGTTTTA 

TTAAATGTTT 

TTGTGTGTTT 

TTGTTATTTT 

TTATTATTAA 

GTTGTTATGA 

TATATTTAGT 

TTAATTTTTT 

TTTTTTTTGT 



AGGGGAGGGA 

CGGCGTGGTT 

GTTTCGTAAT 

TCGGTACGGT 

GGGAGGCGGA 

TAGTAGGCGT 

GCGGCGGTTA 

GTTCGATTTT 

GCGCGTTCGC 

GTGGGCGGGA 

GGCGTATTGT 

TTTTTATTTT 

ACGTGGGAGA 

GAATTCGTTT 

GGTTTAGTCG 

ATGAATGAAT 

GGTATAAAGA 

GGTTTAAGGT 

TTTTGTTTTT 

ATATTTTTTA 

ATATAACGAT 

GTTTTATTAC 

AATTTTTTTA 

GTATTTAGTT 

GATGGGTAAG 

TATGTGTAAG 

AAATTTAAGT 



ANGABEN ZU SEQ ID-NO: 11: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 504 Basen 
ART: Nukleinsaure 
STRANG FORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEK0LS: chemisch vorbehandel te Genom-DNA 



SEQUENZBESCHREI BUNG : SEQ ID-NO: 11: 



AGTAGTAGTA 
AGGTCGGCGC 
AGGTTGAGAC 
GGCGGCGGAT 
TGCGTATTGT 
TGTTAGTTTT 
TTCGTTCGTT 
TCGGGCGGGG 
TTAAATTTAG 



GTAGCGCGTT 
GCGTGAGTAG 
GCGTTTTAGA 
TAGCGGGCGG 
GTCGTCGATG 
CGCGAGAATT 
CGTTTTTTTT 
GTCGGGAAGT 
GAGGTTTTTG 



GAGTTCGGTT 
CGGTAGCGCG 
GTTCGGCGGA 
CGGCGTCGGT 
TCGGTTCGGG 
TCGGTTCGTT 
CGTTTTTCGG 
GGTGGGAGAA 
TTTT 



ACGTAGAGCG 
AGTATCGAGG 
GTTCGCGTCG 
TGTAGTTCGG 
AAGGGTAGTT 
TTGTTGTTGT 
GGATATTCGG 
GTCGTCGTTC 



TTAGTTCGGT 
CGTTTAGTAG 
CGTAGTTCGT 
AGAAACGCGT 
GTTCGTAGTT 
TCGGAATTTG 
GTTTTGAGTT 
GCGTTTGTTT 



GCGGTTTTGT 
GAAGGTGGCG 
TATGGCGTCG 
CGGTTGCGTT 
GCGCGTCGTT 
GCGGGAGCGT 
AGATTTTGTG 
AAATTTAGTT 



960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2536 



60 
120 
180 
240 
300 
360 
420 
480 
504 



ANGABEN ZU SEQ ID-NO: 12: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 2036 Basen 
ART: Nukleinsaure 
ST RANG FORM : Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEKULS : chemisch vorbehandel te Genom-DNA 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 12: 
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AGTAGTAGTA GTTTTAATTT GAGTTTAGCG TATTCGAAGT TTCGTTTACG TTTTTTTTTT 

TAGAGATTTT TAAGTCGGAG GAAAATAGCG TAGTGTCGGT TtSgTTTA GtSES 

HJSSSI TTT TAACGGTTCG GATAAGATGT AGATGGAATT ATCGTTTTTG SaggS™ 

GTTTTTATTA GTTTTTTTAG TAGTCGTCGT CGTTTTAGGA GTTCGCGGTA TCgSSt 

AGTATTTGGT ttacgggtat tatScSg gSSSS 

GTTTTTTTTA GGGGATTATT TTAGTTAACG GGATTATGTT TTTTTAGAAT TTTTrr«w 
ATTATTAGTA gSg C ?S TTTGrrTTrr i™*™^ ™*"5£ 

s ss; sggs ;ss sssss sss ss 

CG^GGC SSSS GCGTACGGTT ATTAGTTTAT TaJSSS? S 

GGTTGTAGTC GTTGTTGTCG TAGTCGTCGT TTCGTCGGTT TCCTTTarTT 
GGAATACGTA TTAAAGCGTG AATGTAGTTT GGAGCGTATC GTTTAATTTT Jrrrrrr^J 

TGTTTTTTTC ££255 CGTCGGGGGG ^CGGtSggG S£S SgSggG 

GTTTAATTTT ATTTCGTCGT TTAAAAAGTT TTTTTTTAGT AArrrrATrr 

S5SS2S gcggtttt ™ ttattt™ gSSSS SJSJS 

SISSSJ AATAATTTGT TGTTATTTTA GGTAATATTT TGTTGTaS 

ATATATTTTT TTTTTTTGTT TCGTTTTTTT TGTTATTTTT TTGATTTTTA ATTnTTTnii 
£™ T * TT TAAA ^ GGG T AGTAATGTTT AGTTTTTTTT 
TTTTTTAGGG TTGTTTTATT ATTAGAGGAT GAGGTTGGGA GAATATTGTG 
GAATCGTATT CGTTTTTTTA GGGTAGAAGA AGTTTTTTTT TTTTAGTTTA JSSS? 
TATGGTGTTT GTATTTTTTA TTTTGATTTT TTTTGATAAG TAAAGTTGTA IdrTrlrrl 
AAGGTGTCGG TATAGTTTTA GGATGAGTAG GTTGAGATTT T^SSS GACTATTTbt 
ATATTTTAGG TTATGTAATT TTGAGTTTAG GGTGTCGTTT gSSSSJ 

ttattttgat tttattttta aagaggttaa taatttttga gtggtgtS? SS??? 

™™ TT TAGTT ^ATT AATGTGAATA TATGTGTTTA TGTTTCgSa IggJgSS 

JJSSImi ??JJJSSI SSSJZll gttgggaaaa tKJSSS St'™ 
tttttatgtt IS A nS S™S cggaggtaap * r GGG ™^ 
acgtgatttt tagagttata ttgtaaS SSSJS SSSSJ? 

= esses; sssss = ™ ™ 

EE ™ = ™= = i 

TATTTTGGGT TGGAAAGGCG TAGTGCGGGT GTGTGTTTAT AGGCGGTTTT TGTTTT 



ANGABEN ZU SEQ ID-NO: 13: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 4 52 Basen 
ART: Nukleinsaure 
ST RANG FORM : Einzelstrang 
TOPOLOGIE: linear 



ART DBS" MOLEKOLS : chemisch vorbehandel te Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 13: 

£™™ GTA GTAATT "TT TGTATTTGTA GTAGAAAATT TATTTTAGAG ATTGCPTATr 

TGTGTTAAGG AGATGGTGAT TTTTTTTGGA TATTTTAGAG ATTTTTTTTT SJSSIrlS 

TTTTATTCGG GGGATATTTA TATAATGTTA TTTTTTTTGA ?SgSS lltll^ 7 

MTGTTATTT TTTTAGTTGT TTGTGTGTTT JSSSSg SSS IItIgIt^C 

TTTAGGAAAG ATTTTTGGGT GTATAAATTA GTTTAGAATA GTTGGtSI ATT^S 

G : GGTGAGGG ^gatgtg gtatISSS sss jsjsjsj 

nSnan*™ ATTTTA ™ TGGAGTTAAG TTGAAGGAAG TGGAATGTTA TAGtSS? 
AGAAATTAGT GGGTATTGGT GGTTTTTGTT tt a a AGTGTTTAG 

ANGABEN ZU SEQ ID-NO: 14: 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2036 



60 
120 
180 
240 
300 
360 
420 
452 



SEQUENZCHARAKTERISTIKA: 
LANGE: 513 Basen 
ART: Nukleinsaure 
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ST RANG FORM : Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 



SEQUENZBESCHREIBUNG : SEQ ID-NO: 14: 



AGTAGTAGTA 
GGGCGAGCGG 
TTTCGGGCGC 
GAGGGGCGGG 
CGGTTTTCGC 
TTCGCGGTTG 
T AG AG AG AG G 
AAAGGGCGAT 
TGTTTAAGGG 



GTAGCGGAGA CGGAGGCGGC GGCGGAGGCG GCGGCGGCGA TTTTAGCGCG 
CGGGGTTTAT GGTCGGATTC GGCGAGTTGG TTTAATAGTG GGGTTAGGGG 
GGGGGGGATC GGAGGGAGCG AGGTCGTTGT CGGACGGGGC GGGGCGTCGG 
GTCGCGGTCG GACGGGGCGG GGTATTAGGA GGAACGGAGT GGGCGTTTGG 
GTTTAGATTG GGTCGCGGGC GTTTTTTGGT GGTCGCGGAG AGTTTAGGTG 
AGGGAGTTGG AGAGGGGTAA AATCGGGGTC GTAGCGGGAA GGCGGAAAGT 
AGGTGTTTCG GTAGCGGACG CGTTAGCGGG GTAGATAGGA AAATAGTTGG 
TTGGGGGAGT AG AG AT AC G A TTAGAGTTTG AGAAGGGTAG GAGTAAGGGA 
GTTTGGTGGT AGGTTTTTGT TTT 



60 
120 
180 
240 
300 
360 
420 
480 
513 



AN GAB EN ZU SEQ ID-NO: 15: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 980 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 15: 

AGTAGTAGTA GTATTTTCGG TTATAAGGAT TTTTCGAGTT TCGTTCGTCG GTCGCGGATT 60 

CGGTTTTTTT TTTTTCGGTC GTTAGGGGGC GGGTTCGGAT TATAGGATTG GAGTTGGGCG 120 

GAGATTTACG TTCGGAGCGG TTGTGAATTG GTAGGCGGTG GGCGCGGTTT TTGTGTCGTG 180 

TTTCGGGTAT TTAGTTTTTT AACGGGGTTT CGGAGTCGAA GATAGTTTTA GGGTTTAGGG 24 0 

AGCGCGGGCG GTTTTTGGGC GGCGTTAGAT TGCGGTGAGT TGGTCGGCGT GGGTTATTAA 300 

TTTAATGTAG TTTAGGGCGG CGGTACGAGA TAGAATAACG GCGAATAGGA GTAGGGAAAG 360 

CGTTTTCGAT AGGTTAGGTT TAGGGATTTG CGGGGAGAGG GCGAGGTTAA TATTCGGTAT 4 20 

GGGTTTTTGA TTGGTTTTTG GGATTCGTTT CGTTTACGTT TATAGGTGGG TTCGTATTTT 4 80 

TTTTTGCGTT TCGTTTTCGT TTTAATAGTT TATAGTTGTT GTTAGTTTAT TCGTACGTTT 540 

CGAATTTCGT TCGAATTCGT TATTGGTTGT TTTTTAGCGG TTTGTGTTGA TTGGTTGTTC 600 

GAAGATTCGT TTTTTTGTCG TGGGTTTAGT TTCGTAAATG CGTAGTTAAG CGGGTGGTAA 660 

GGGGCGGGTG GAGCGCGGGG CGCGACGGCG GAGGGGGGCG TGGGTAGTCG GACGTATTTT 720 

GGTAGGGAGT AGTAGGTGGC GGCGGTGTAT GGGGTTTGGT TTTATTAGCG GGTATTGGTT 7 80 

TATAGTTACG GTCGGGGGGT TATTTAGTTG GAGAGAGAAG GGATAGGTGA TTCGATCGGA 840 

GTTTAGTTTA GTTTTTAGCG GTGGGGCGAG AGATAGCGAG GGGAATCGAG GTTGGGGAGG 900 

TTATTTAGGG AGATTTCGGA GGGAATTTGG TGAGGTTTGA ACGGAGGGAG ATTTGGGGTT 960 

GAATAAAGGG TTTTTGTTTT 980 

ANGABEN ZU SEQ ID-NO: 16: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 223 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 16: 

AGTAGTAGTA GTAATATTAT TTTATTAAAA AAATATTAGC GTAGTTTTTA ATAGAGTTTT 60 
ATTTTTTAAA GTGAAGTTAA AAATAGGTTT TATGTTTAAA GTTTTTTTTC GTAGTAGGCG 120 
ATACGCGTAG ATGGAGAAAA TATTTTTATT GTTGGGAAAG GGAGGCGTGT TAACGGGGAC 180 
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GAAGGATATT TTATTATTTG GTAAAGTTAT TGGTTTTTGT TTT 
ANGABEN ZU SEQ ID-NO: 17: 



223 



SEQUENZCHARAKTERISTIKA: 
LANGE: 1145 Basen 
ART: Nukleinsaure 
STRANGFORM : Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEKOLS : chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG : SEQ ID-NO: 17: 

AGTAGTAGTA GTTTTGGGTT TCGTTTAGTC GTAAGATGAG TTAGTTGGGT TTCCTrrrrr 
TTGTATTTAG GTTACGTTTT TTTAGATTCG TTTTTTTTTA TTAGATTACG Statppttt 
TTTAGTTCGT TTTTGGTTTA GGTTTTTTTT TGTTTTTTTC SfJJSJSS SgmSSI? 
TTTCGTTTAT TTTTTTCGGT TTTTTTTAGT TTTGTTTTTC GGATTTTCPT rrnr™™ 
AAGTTTTTTT TTTGGCGATT AGGTTTTTTT ATTATTTAGG S?5??m 
TTGGGGCGGT TTGTAGTTTT ATCGTCGAGG AAGAGGAAGG CGTTCGTGgJ SggSSt 
AGCGATTCGT TTTCGTCGTA TCGAATTCGT AGTTTTATTA TTATGTTTAT llrrlrl^l 

SSSS? tS A , TAGTT TGGTTGGGGA ssss 

nllwZZl™ GCGGGCGT CG TTTTAGTTAT TACGGGTTCG GTCGTAATCG GAAGTTTTTT 
GG J^™ T TTTTAATTCG GTGTGTGGTT AGGAGTCGAG TTTTATCGAT CGGgSS? 
GCGTTTGGAT TGAGATTTGG AGGTTATATT AGGATTTGCG GTTATTGTCG TTATTarrnr 
r^r G £ GG TCGGGG ^AA GTTTATAAGT CGAGGGGCGG GGTTCGTGGC S 
GATAAGGGAT AGTTGTAATT GAGTTCGGGG TGGAAGGGGT GGGCGTTTCG 

???JS5?gS SSSr^ ^"TTT SSSJS sss 

illfllliIGG TAGGGGATGT TGGAGTAGAT GTCGTGGTTG TATTTTTttt ai. S fr3^ 
GTGGTTTTTT TGTTGGCGGG TTTAGTAGTT GGTGGTCGTG SSSSSS rlirrlrrlZ 
GGTTACGAGG TTGAGTAGAA TGTTTTTATT TTGGAGGTTT SSS JS 
GAGGTTGTAG TCGGGGGTTA TAAGGGTAGG ATGGGTTTAG GTTtSS S2£?X ,no« 
J™ TTGAG OGTTOSTTT TTTTTATATT TTTTTTTTGG JSSSS 1140 

1145 

ANGABEN ZU SEQ ID-NO: 18: 

SEQUENZCHARAKTERISTIKA: 
LANGE : 633 Basen 
ART: Nukleinsaure 
STRANGFORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKOLS: chemisco vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 18: 



cSJSSS rlrl^ll CG GCGTTGGT ™ GCGGTTTAGA GTCGGGGTAG GGAGGGTTTT 
^ I T G ™ GGGGTTAAGA GGTCGTTTTT AGTTCGGGGT AGTTCGCGTA TTCGAGTTTC 
GAGTTCGGAG TTTGGAGGGG TGGGGAGGTT TCGCGTTTAG GGTCGGATCG GACCrtrllr 
CGCGGGAGTC rll^ll™ CGGTTTTCGT CGTTAGTCGA ^GgSgS GGGCGgSS 
TfTTTPraTa GTAGTTTTTT TCGGGGGGCG GATTCGGTTT CGGCGGCGGT ATTTAGTTTT 

=S SSSSS S£K£ 53SS5 S?S 

S= S522ES SSSS "22S! ?l™ ™S 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 



60 
120 
180 
240 
300 
360 
420 

ZgSSSZ S» i^SSSKSi SS5SSSS ss 

SS SSSSS S CGITTT " GITGGGTSGT CGOTMG ™ sss 

633 



ANGABEN ZU SEQ ID-NO: 19: 



SEQUENZCHARAKTERISTIKA: 
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LANGE: 12 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEK0LS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 19: 

AGTAGTAGTA GT 12 

ANGABEN ZU SEQ ID-NO: 20: 

S EQUEN ZCH ARAKTER I ST I KA : 
LANGE: 12 Basen 
ART: Nukleinsaure 
STRANG FORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 20: 

ACAAAAACTA AA 12 

ANGABEN ZU SEQ ID-NO: 21: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 74 Basen 
ART: Nukleinsaure 
STRANG FORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 21: 

AGTAGTAGTA GTTTCGGTAG TTTAGTTTAT GGCGGCGGTG GCGGCGGTAG TAGGTTTGAG 60 
TTTTAGTTTT TGTT 7 4 

ANGABEN ZU SEQ ID-NO: 22: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 103 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEK0LS: chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 22: 

AGTAGTAGTA GTAGCGGTAG CGGTAATAGG GCGGTTGAGA ATTCGGCGGC GGCGTTTTTT 60 
TTCGTTTTTT TTTTTTTCGT TTCGTCGATT TTTAGTTTTT GTT 103 

ANGABEN ZU SEQ ID-NO: 23: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 559 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 
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ART DES MOLEK0LS : chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 23: 

SSS?2 AAAAAATAAA TTTTTTAAGT ATTTAGTGTA GTTTTTTTTG 

sss™ ??ssSt ™ tttttgt ™gSS 

TTAATTTTTG ptttt ^ 1 »™ TCGTAT "AGTTAAAA GTTGAAAATA AGTGGTCGGA 

KSSSS SS JJJSSSf sssss SS SSiiT* 

ATCGAGGATT SS SSSSS 

gg?S SSSSSS? m£?S? JSSJS?; ^ ggattgga assess 

TTTTTflTiTT TBAr-nnmCmi ^ iCjATTTTT ATGGTTGTGA TTGATGTTGT TATTAGATTA 

Sm{gJ T GAATTATTTA AACGGATTAG TATAAATTAA ATTaSS 



ANGABEN ZU SEQ ID-NO: 24: 

SEQUENZCHARAKTERISTIKA: 
LANGE: 1695 Basen 
ART: Nukleinsaure 
STRANG FORM : Einzelstrang 
TOPOLOGIE: linear 



ART DES MOLEKOLS : chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 24: 



SSSSS SKSSSS 52?*™ ™™*™ 
= SS «S2£g 

CGTTTTGTTA GTAGTCGTTT CGTCGTTTTT TTCGGTTrrT GGTTTCGCGT 
GTCGGTTCGG GTTTTTGGAA TTTTir.rrr rJSISS ^GGTAATCGT CGCGGGATTC 

ESS SEES = » 

SE22 S= — G ™ SKJ 

SS SSSSS SS533S 22KSS sS ™ ? 

GAGGGAGAGA GGGGGCGAAG ACGGTCGGGA AATTCGGGGT JSSm 
GAGTCGTGAC GGATTTATTG TAGCGGTCGC GTTGATTCGT aSJSIS rfrr^l° G 
GGGGAGGGTA GAGAGGGAGG GGAAAGCGGA GTGTTGTAGC Wclcc^rf rrrnf^^ 
TCGCGAGCGT CGTATATTCG GGAATTTGTN GTTTCGTTGC rrrrra™ GGGCGGGTT T 
GGCGAGTTTT GGTTGGGGAA NTTTGAGCGC SgSIcG toSSS 
TTTTTGCGTG TAGGGTGGGG GGAGGTTAGG GGCGGGGGCG CGctrrlJ-rr ^I GGGTCGT 
TGGCGGAGTT TTTTCGGTTA TGTGGTTrrA rrrrrrrrrr CGGACGTCGG TGACGTCGCG 

GGGAAGGAGG AAaSg SSSSg gSS cSSf 

AGCGAAAGGG GGATAGGGGT TTTGGAGTGG A AfTTTTrrr rrZt^ CGCGAGTGTT 
TAGTTTTAGG GTGTTAGaS SSSSSl S £ SSS 

TTGCGAGAGG TAGTTAAAGG TATTTGTGTA TTCCTCThTr PaC^^V^T ^TTAAGTT 
TTGTACGGTT TATTAGGATT SSSSS JmJSSi 

ATGAATTGGT AGAGTTAGGA ATTAGGTTGT AAAGATAGAG AAGCGAGtS aSSSJ 
IKS™ CGTGGGGAGA ATTTGGGTAA ACGAGGAGAA GGGAtSJJ SSSSr 
JSSIS5 ^T T T TAGTTT TGTATT ™ TAAATCGTTT AGATTTTTTT T^gSggS 



ANGABEN ZU SEQ ID-NO: 25: 

SEQUENZCHARAKTERISTIKA : 
LANGE: 722 Basen 



60 
120 
180 
240 
300 
360 
420 
480 
540 
559 



1695 
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ART : Nukleinsaure 

ST RANG FORM: Einzelstrang 

TOPOLOGIE: linear 

ART DES MOLEK0LS: chemisch vorbehandelt e Genom-DNA 

SEQUENZBESCHREIBUNG : SEQ ID-NO: 25: 



AGTAGTAGTA 
AGTTTTTGTG 
TTCGGGGTCG 
GCGTTTGTAG 
TTCGCGTTAA 
TTGTTTTTGT 
TTATTTTACG 
TTTTTTTGTT 
TTTGTTGATT 
GGGTAGTTAT 
ATATTGGTTA 
GTTTTCGTTC 
TT 



GTTTCGTTAC 
GGACGTTGGC 
AGGACGAGGG 
TTGTTCGGGG 
GTTTGGTTTC 
TTCGACGTTT 
TTTTTGTTAA 
TTTTCGTTTT 
TGGGATTTTA 
TTGTTTTTTT 
GTTTTGTCGC 
GTCGTTTGTA 



GAATACGATT 
GCGTATATCG 
AGGCGAGTAG 
CGAGGCGGGC 
GGGGGTGGTT 
TTGTTAATTA 
TTTGTTTTTT 
TCGTTAAGGT 
CGAGTTTTTT 
CGGGATTTAC 
GATATTAGCG 
GTTTTTATTT 



AGTTTATATT 
TTTCGTCGGG 
GTCGTTGGTT 
GATTTTAGGT 
GTCGTCGGGT 
GTATTTTTTT 
TTTTTGTTAT 
ATTATTTTGT 
TGTTCGTTGT 
GCGGATAGTT 
CGTNTTTTCG 
TTGAGTCGAC 



GGTTGTTTAG 
GGGTCGGGGA 
TCGACGATTT 
TTTCGAGTAT 
TTCGTTTGCG 
TTTTAATTTT 
TTTTCGACGT 
TTATTTATTT 
TTTTTATTGG 
TTTCGTTTTT 
TATTTTCGTT 
GTTCGTTTAT 



TATTTCGGTT 
TTTCGGGGAT 
TGCGATCGAG 
TTTCGAGATA 
TTTTTGGTTT 
TTTTCGATTT 
TCGTTTTTTT 
AGCGTTTTAT 
GTAACGTTCG 
GATTTTTGGG 
CGCGCGTTCG 
TTAGTTTTTG 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
722 



AN GAB EN ZU SEQ ID-NO: 26: 

SEQUENZCHARAKTERI STI KA : 
LANGE: 517 Basen 
ART: Nukleinsaure 
STRANG FORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEK0LS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 26: 



AGTAGTAGTA 
TTTAGCGAGT 
AGTATTAGTT 
AGTAGCGATA 
AGGAAGGCGT 
GTTACGTATA 
GGGGAGAGGG 
T T T T T 
GCGGGTGTAG 



GTTCGAATTC 
GGCGCGTTAG 
TCGCGCGTTT 
CGTAGAACGG 
ATTTGTTTTC 
CGGTTTTTAG 
GATACGGGGT 
TAGGATTAGA 
GGGATATTGA 



GCGCGCGTAG 
GCGTATTACG 
TAGGAGTTTG 
TAGGAGCGTT 
GGTTTGTAGG 
TACGAATAGG 
TGGGGGCGTA 
GGCGTTTTTT 
TAGGTTTAGT 



CGGCGTATGG 
TAGAGTACGC 
GTTTCGTTCG 
AGGATGTTAA 
GAGCGTAGTA 
TTGCGGTATT 
GGTTTTTTGG 
AGGTTATTTT 
TTTTGTT 



TTAGGTTTAG 
GTAGCGTACG 
GGTTTGTCGT 
TGATGTTGAG 
GGAATTCGAA 
TGGGGGAGTA 
AGGGTCGGGG 
TTTCGTTTTA 



CGAACGTAGT 
TAGTAGTCGT 
TAGTTTTAGT 
TGGCGCGCGT 
GGAGAATTAG 
TTCGTTTTGC 
GCGTTTTGTT 
ATTTACGGAA 



60 
120 
180 
240 
300 
360 
420 
480 
517 



ANGABEN ZU SEQ ID-NO: 27: 

SEQUENZCHARAKTERISTIKA : 
LANGE: 1078 Basen 
ART: Nukleinsaure 
STRANGFORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 27: 



AGTAGTAGTA 
AGGGTTTAAG 
GTTCGTTTTT 
TTTTATTTAT 
TTTTTTTGGG 
TTGGTTTCGG 



GTATTAGTAA 
TAGGTTCGAC 
TCGGTATTGA 
ATTACGACGA 
CGGAAGTTTT 
TCGTAGAAGC 



TAGTAGTACG 
GAAGATTCGT 
AACGCGATCG 
CGGACGTTCG 
TGAGCGTGAT 
GAGATGGTGA 



AAAAGTAAAA 
TTATTCGGTC 
GTTTTGTTTG 
AGAACGTTGT 
ATAGCGGAAG 
GTTGTGATTG 



TTGTAATTTA 
GTTAGAAAAT 
GTATCGTATT 
ATCGCGTTTC 
TGTTTTTTTT 
TGGTGTTTGT 



AACGGTTTTT 
TGGGAGTTTC 
TTTTTTTTGA 
GTAGGAAGTG 
TTCGGTTTTT 
GAATCGCGTT 



60 
120 
180 
240 
300 
360 
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SEQUENZCHARAKTERISTIKA: 
LANGE: 2 94 9 Basen 
ART: Nukleinsaure 
STRANG FORM: Einzelstrang 
TOPOLOGIE: linear 



420 
480 
540 



TTATTTTCGT TTTTTGTGTT TTTTTGTTTG TTfiTPTTTrr rrw-mm^m 
TAAGGGGAAT TGGTGGGTTG GAaSSa "cgSggS SSgaS iSSISS" 
TTGTTAATTG GTGTTTGGGG GATTTATTTC GTCTTAAttp 1™^°™ AGAAGAA TGA 
GTTTTTTGTT TCGGTTTAAT TtSSSS SSJS SKgStS 
GAGGGAAGGA GTTTGGGAAT GTTTrrTTTT r^A™*^;,!, TTTAGTTTTG GTTGGGAGTC 600 

TTTTTTGGTC GGaSS SaS gSSSKSI SS ^ GG J GATG 660 

GGTTTTAGGT AACGTGAAAT GCGGGTAGTG GTTTTtcS S S rrll^™ ?2 ° 

TTTTTTCGTA GTTTCGATTT TTACGATTGT TTTTaMT^ CGT GGAAAG AGGT 780 

GAGAATTCGA GTAAATTTAG AAGTT6TTAG St^IH ™ TTAGTAAT TGGTTTTTCG 84 0 

AGACGAAGGG AACGTTATCG mllp^lcr rrrll^l TATTTATTTT TTTAATGTGT 900 

GTTGTGGTTT TAAGGTTTA? tISSga trvrr^l^ GACG ™CG TTGTGTCGTC 960 

ttaagcgtaa gagaaIg^? SSS J5S2SK SSSSS SEE* 8 

ANGABEN ZU SEQ ID-NO: 28: 



1020 
1078 



300 
360 
420 
480 
540 



780 
840 
900 



ART DES MOLEK0LS: chemisch vorbehandelte Genom-DNA 
SEQUENZBESCHREIBUNG: SEQ ID-NO: 28: 

AGTAGTAGTA GTCGTAGGAG TAGCGTTTTG GGGAGGGGGG TTCGTTTTTP frrrvrr-^ 
TCGTGGTTAT TTTTTTTAAN GGGGGTCGTG GTCGTTTTTT AGTtlrrrrr ™J GCGTT 60 
GTTTTAGCGG GGTTCGTCGG GCGGGGCGGG GATTTgSS CGGGGCrTTT Sf TC 120 
CGCGGGTTTT CGTTTTTTTT TTTGTTTTCG GGCGAGtS StSgtT? rrlrrrr^ 180 
TTTCGTTTAT TTGTTAAGTG AAGGTTTTAr rrra™.™™ «ATTTTGTTC GGTCGCGGGG 240 
TTTTTTTTAG TTAAaJSg SS aSSS KSS 
TTTTTTTTTT TTTTTTTTTT TTTTAGGAAT ATATTTTATT JSStTtT Itrlrfnlll 
AAATTTTTTC GTTTTTGAAG GCGTGGTGTT GTTGGTTGTT cr^nlr-llll TAGAGTAGTA 
GTTGGTTTTT GTTTTTTTTT TTTPP^tttt vll^tZZ* CGCGAGTGCG GAGAGGGGAG 
ATTTTTTGCG SSSaS S?fe55 JJLIII"' TTTTAGGAAA 

AAATAAGAGT TTTTTTTTAT TTTTTTCrS Ir J-^ll^ GGAGTTTT TG GTTGTTTTTG 600 
TTTGGGTAGA AATTaSa^ SgIS SagS SSISII™ 66 ° 

SS SgaS SSa GTGGGTACGT 

GTAGAGTGTA TCGACGGCGG GCGTTGGCGT TCGTCGTC?? ccirrlrzrl ?H ACGGTTC 
GTTCGTTTTG CGTTTTCGTT CGCGTTTTTT TTTtSSI TGTAGTAGG A 960 

TTTTTTTTTT TTTTTTTTCG GGCGTTCGTT £t^^™ TTTTTTTTTT 1020 

TTTTTTTTTT TAGAGCGGGG ATTGTCGAM CclrrrrfrJ. GGTTTTT ^T 1080 

§1 in m m if II 

SSS SSSSS SEES CGTTGGCG " ™^ " ™ = 

^^i^iAbbl I 1GGGCGGGG GGAAGAAAGG GGAGATAAAA Gaci&rmrr rnr*r**r^~ti 

SSSSS* aaggaagggg SS SSSKg? 

TATTTAGTAC GCGTCGGGTT GTTTATTTTT TTATTTTfTT TTrrw^.r ^mm»i 
CGCGCGGTAC GGATGTATTA TTTAAGTTAA SSI'S ttt!^^ ' 

TTAAAGTTTT TTTTTTTTTT TATTAGTCGG TTTTTTTTTT ^1^11 rrr^rln^ 1680 

cgggggttcg tatcgttaag agttttggtc gtggttacct tttttggaaa SSSSSS^ 1740 

TAATTTTTCG TAGTCGTTGC GCGTCGGCGG SS JgSSSt? TTCGPATPtt 18 °° 
ATTATTTGGG AAATTTGTAG TTTAGGANNT TCTrrCTrrr rrrrlr^nll TTCGGATGTT I860 

tcgtgtcgtc gttttttggt tttttSS 5??S£2? A ™ GGTT 1920 

SSSSS 5™™ GGATTCGTG? CGTGTTTTTG J5£?5£ IZ 

G t G J G ^™ GT TAGCGGAG TC GTGCGATGTA TTTGAAAAGT AATTAGTTCG ATTTTTTTTT f?™ 

aS^ TGTA TTCGATTTTA a TGGTTTTAG AAAT???S GgSSaGGA 2 0 

ttcggtcgaa agaacgggga tcggttattc gcgttttttt ttgttttatc GTTTTTTCGT 2220 



1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 
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GTGTGTGTGT 
TTTTTATTTT 
CGTGGTGGAT 
TAAGGGGGAT 
GGGGTGGGGG 
AAAAGAGAAA 
AATTAATTTA 
TATTTCGTAT 
GTATTTGGTA 
GCGTTTCGAT 
GAGCGTAGTT 
GTTTTCGCGT 
GTTTTTGTT 



GTGTGTGTGT 
TAGGTATGGT 
GGGGTTGGCG 
GGGAGGGGGA 
GACGCGGTTA 
GTGGTAACGA 
ATTCGGATAT 
TTTTAGTTGC 
GTTTCGAGTT 
TAAAATGTGA 
AAGTGAATTT 
GATTTTAAGA 



GTGTGTGTGT 
GGTGTTTTTT 
GCGATAAATG 
GTGTATTCGG 
AGCGGAAACG 
AAATAAGGGT 
TTAATAAATA 
GGGTGCGTTC 
CGAGCGGTAG 
ACGGGTTTGT 
AGTGAAAGTA 
TTAATATTAG 



GTGTGATTAG 
T T T T T T 
TTTTTTTAGT 
TAGGCGAGAG 
TTGTATAGAG 
AAATTGAGTT 
TATGGTTTTT 
GTTTGCGTTC 
TTTAGGACGT 
T T T T T T T T T T 
GGAGTTTTTT 
ACGCGTAGAA 



CGGTGGGGGG 
TTTTGTTTTA 
TTTAATTTAG 
AAGCGGGGGT 
GAATTTTAGC 
TTTTTCGGGG 
AATGAGCGTG 
GTCGTTTTTA 
AGTCGAGGAG 
CGTTGTATCG 
TGTTTAGTCG 
TTTATGTAGG 



GTTTGTTCGT 2280 

GATGGATTTG 2340 

TTGAAAGAGT 2400 

GGGGTGGGGT 24 60 

GAATTAAGAA 2520 

ATTTTTAATG 2580 

CGTGTGCGTG 2640 

GTTAGAGTTT 2700 

CGTCGTCGGT 27 60 

TGTTTTTGTC 2820 

TAGTTAGGTA 2880 

TTTTTGTTTA 2940 

2949 



ANGABEN ZU SEQ ID-NO: 29: 

S EQUEN ZCHARAKTERI STIKA: 
LANGE: 117 Basen 
ART: Nukleinsaure 
ST RANG FORM: Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 

SEQUENZBESCHREIBUNG: SEQ ID-NO: 29: 

AGTAGTAGTA GTTTATTTTG GGTTGATATA AAATTGAAAA ATTTATTTGT TTTTTTATTT 
TTTTGGGTTG GATTCGGTGT ATCGGTTGAT ATATTT.TTTT GGTTATTAGT TTTTGTT 

ANGABEN ZU SEQ ID-NO: 30: 

SEQUENZCHARAKTERI STIKA: 
LANGE: 639 Basen 
ART: Nukleinsaure 
ST RANG FORM : Einzelstrang 
TOPOLOGIE: linear 

ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 



60 
117 



SEQUENZBESCHREIBUNG: SEQ ID-NO: 30: 



AGTAGTAGTA 
AGTCGCGACG 
GTCGGGGTTT 
TCGACGGTTG 
GTTTTTTAAG 
ACGGTTTAGA 
TTGAGATTCG 
GATTGTTGTT 
TTTTTGATGG 
TGTTGTTTAT 
ATTTATTTTG 



GTATTATGGT 
TTGTTAGGGT 
TTCGCGGGTT 
TTTTTCGTTT 
TCGTTCGTTA 
GTTAGTGGTT 
CGGTTTTTCG 
TTTTTAGGGA 
AGAGGGGATT 
CGGGCGCGAT 
TTATTTTTGT 



TATTTCGACG 
TAGTAAATTT 
AGGAGGCGGT 
TTTTTATTTT 
AGGGGAGGTT 
TTTTAGTATT 
GACGGTTGGT 
TGGCGCGGTG 
GTTTTTCGCG 
TTTTTAGTAG 
CGCGGTTTTA 



GTCGCGTTCG 
TTTTTATTTT 
GATTCGTTTT 
GTTTTTGCGG 
TTTCGTGGGT 
TTTTCGTTTA 
TTTTTAGGGA 
TTTGGGTTTT 
TTTCGGACGT 
GTTTTGCGTT 
GTTTTTGTT 



ANGABEN ZU SEQ ID-NO: 31: 

SEQUENZCHARAKTERI STIKA: 
LANGE: 304 Basen 
ART: Nukleinsaure 
STRANGFORM : Einzelstrang 
TOPOLOGIE: linear 



TTATTTTTTT 
TGGGCGTAAT 
GGGTTTGGGT 
GTTTTAGTCG 
TACGTTAGGG 
GTTTTAACGA 
TTTGAGATGT 
AGATTGTTTA 
TTCGGGTTTT 
TTGTTTTTTG 



GCGGCGGTTT 
GGTTGTCGGG 
TTGTATTTTT 
CGGCGGTGTC 
GTAGTTTTCG 
TTTTGGGTAT 
TTGTTTTTTA 
GATAGATTAT 
GAGTTGCGGG 
GTAAGTATCG 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
639 



ART DES MOLEKULS: chemisch vorbehandelte Genom-DNA 



i 



• 0 

1 
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SEQUENZBESCHREIBUNG : SEQ ID-NO: 31: 

AGTAGTAGTA GTATAGTTCG GCGTTGGTTA GCGGTTTAGA GTCGGGGTAG CTArrrTTTT 
CGTGCGGACG GGGGTTAAGA GGTCGTTTTT AGTTCGGGGT AGTTCGcSa , 
GAGTTCGGAG TTTGGAGGGG TGGGGAGGTT TCGCGTTTAG GGTCGGATCG GAGGctclrr 
GAGAGCGGTG GTTTTTTTTT CGGTTTTCGT CGTTAGTCGA TCGGGGCPTT 
CGCGGGAGTC GTAGTTTTTT TCGGGGGGCG eSKSgJ SSggcS 



TGTT 



180 
240 
300 



304 



